郑滔
- 作品数:55 被引量:99H指数:6
- 供职机构:南京大学软件学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金江苏省林业三项工程项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字政治法律更多>>
- 软件工程专业实践教学体系中企业合作机制的探讨
- 针对实践教学体系建设的研究,一直是软件工程专业教学研究的重要课题。近年来,随着我国软件产业的快速发展,对高水平、实用型软件人才的需求进一步加大,因此,高校和产业界均加大了对软件工程实践教学体系的研究力度,我们认为,与产业...
- 郑滔赵志宏刘嘉
- 关键词:软件工程专业实践教学校企合作
- 文献传递
- 大语言模型在代码优化任务中的能力探究及改进方法
- 2025年
- 代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用传统代码质量评估指标(例如,BLEU,CodeBLEU,edit progress)对4种主流大语言模型和4种代表性小规模预训练模型在代码优化任务的表现进行评估,发现大语言模型在审查前代码优化子任务的优化质量劣于小规模预训练模型.由于现有代码质量评估指标难以解释上述现象,提出基于Unidiff的代码优化评估指标,量化优化过程中的变更操作,以解释劣势原因并揭示模型执行变更操作的倾向性:(1)审查前代码优化任务难度较大,模型执行正确变更操作的准确度极低,且大语言模型比小规模预训练模型表现更为“激进”,即倾向于执行更多的代码变更操作,导致其表现不佳;(2)相比小规模预训练模型,大语言模型在代码优化任务倾向于执行更多插入(ADD)和修改(MODIFY)变更操作且ADD变更操作平均插入的代码行数较多,进一步证明其“激进”性.为缓解大语言模型在审查前优化任务中的劣势,基于大语言模型和集成学习提出LLM-Voter方法,包含Inference-based(基于模型推理)和Confidence-based(基于置信度选择)两种子方案,旨在集成不同基模型的优势以提升代码优化质量.在此基础上,进一步引入优化判定机制,以增强模型的决策稳定性与可靠性.实验证明:基于置信度选择的LLM-Voter方法能够在大幅提高EM(exact match)值的同时获得优于所有基模型的优化质量,从而有效缓解大语言模型的劣势.
- 王志鹏何铁科赵若愚郑滔
- 关键词:代码审查
- 基于DHT的分布式网络负载均衡研究
- 2012年
- 为了解决基于DHT(分布式哈希表)的分布式网络中单个节点负载过热的问题,提出了一种具有良好扩展性的负载均衡解决方案。在该方案中,单个节点自主完成负载平衡的操作,保证负载过重的情况不会发生。分析和实验结果表明,该方案在消除Chord DHT网络单个节点负载过热问题的同时,还拥有节点自我负载平衡和实现成本不受系统规模影响的特点和优势,因此具有良好的实用性和研究参考价值。
- 周立郑滔
- 关键词:负载均衡分布式哈希表分布式网络
- 一种基于不完全抽象语法树的代码语法错误修复方法
- 本发明公开了一种基于不完全抽象语法树的代码语法错误修复方法。针对代码编译错误,该方法实现了对代码编译错误的定位与纠错。该方法利用不完全的AST信息,构建包含代码结构信息的输入序列,使用图模型传播、更新相邻节点之间的信息。...
- 李斐吴礼蔚吴优华刘峰郑滔
- 文献传递
- 基于HeteroPastry的P2P网络代理系统
- 2009年
- 针对集中式网络代理服务器经常产生瓶颈的问题,提出以P2P方式提供网络代理服务的解决方案。参与系统的节点组成一个基于HeteroPastry协议的P2P覆盖网,系统在覆盖网中挑选一些合适的节点组成代理链,以响应用户的不同请求。实验结果证明,该系统可以在提供高质量服务的同时有效地平衡网络负载。
- 伍伟绩郑滔
- 关键词:对等网络网络代理
- 基于分形维的决策树构建及应用研究被引量:2
- 2009年
- 针对决策树构建过程中易于出现数据碎片、子树重复等问题,提出了基于分形维构建特征数据集的方法:因为信息增益表示了该属性信息量的多少,因此在确定了数据集的嵌入维数k之后,选择信息增益最大的前k个属性构造原数据集的特征数据集,并分析了依据分形维数和信息增益对冗余属性的删除以及特征集的信息损失对决策树构建的影响。实验过程中,分别采用从原始属性中选择及拟合两种方法构建特征数据集,依据对实验结果的比较分析,进一步证明了该方法的有效。
- 李广水郑滔孙梅
- 关键词:决策树分形维数信息增益数据挖掘
- 一种增强QR码纠错能力的改进方法
- 增强QR码纠错能力的改进方法,利用数据区的未使用空间,不再是填入预定的特定数据,根据已填入数据计算纠错码,再将纠错码数据填入未使用空间;额外纠错数据长度填入QR码功能区定位图形区域中;纠错码和原始QR码一样选择RS码进行...
- 郑滔詹珣刘嘉
- 服务器-客户端协作的跨站脚本攻击防御方法被引量:2
- 2011年
- 在网络应用的链接中注入恶意代码,以此欺骗用户浏览器,当用户访问这些网站时便会受到跨站脚本攻击。为此,提出基于服务器端-客户端协作的跨站脚本攻击防御方法。利用规则文件、文档对象模型完整性测试和脚本混淆监测等方法,提高脚本的检测效率和准确性。实验结果表明,该方法能获得良好的攻击防御效果。
- 许思远郑滔
- 关键词:跨站脚本攻击
- 基于单元的分布式计算模型CalUnit
- 2005年
- 本文在JUnit单元测试技术的基础上,提出基于单元的分布式计算模型CalUnit。对CalUnit设计模型及实现方法进行了较详细的论述和分析,系统测试表明其计算速度提升十分可观。该模型可作为一种实用型分布式计算框架结构,并扩展分布式计算的应用领域。
- 刘盛邵栋郑滔
- 关键词:分布式计算模型测试技术
- Mashup研究综述被引量:9
- 2010年
- Mashup作为Web2.0上一种代表性的应用构建方式,已经得到了众多的研究者和开发者的关注。目前,针对Mashup的研究主要集中在Mashup数据源的转化和集成、系统的设计、支持工具和平台、对软件工程影响、Mashup的质量属性以及在特定领域的应用6个方面。在这些研究成果的带动下,Mashup逐渐变得可用,但在达到"用户作为开发者"这一最终目标之前,仍然有一些困难需要克服。
- 祁晓晖郑滔
- 关键词:MASHUPWEB2.0数据集成屏幕抓取