计算机科学 > 软件工程
[提交于 2025年7月23日
]
标题: 上下文代码检索用于提交消息生成:一项初步研究
标题: Contextual Code Retrieval for Commit Message Generation: A Preliminary Study
摘要: 提交信息描述了提交中的主要代码更改,并在软件维护中起着关键作用。 现有的提交信息生成(CMG)方法通常将其视为一种直接映射,输入代码差异并输出一个简短的描述性句子作为输出。 然而,我们认为仅依赖代码差异是不够的,因为原始代码差异无法捕捉生成高质量和信息丰富的提交信息所需的完整上下文。 在本文中,我们提出了一种基于上下文代码检索的方法,称为C3Gen,通过从仓库中检索与提交相关的代码片段并将其纳入模型输入,以在仓库范围内提供更丰富的上下文信息,从而增强CMG。 在实验中,我们使用四个客观指标和三个主观指标评估了C3Gen在各种模型上的有效性。 同时,我们设计并进行了一项人工评估,以研究C3Gen生成的提交信息如何被人类开发者所感知。 结果表明,通过将上下文代码纳入输入,C3Gen使模型能够有效利用额外信息,生成更具全面性和信息量的提交信息,在实际开发场景中具有更大的实用价值。 进一步的分析强调了对基于相似性的度量标准可靠性的担忧,并为CMG提供了实证见解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.