Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.14642

帮助 | 高级搜索

计算机科学 > 人工智能

arXiv:2507.14642 (cs)
[提交于 2025年7月19日 ]

标题: 基于比较学习的高效故事点估算

标题: Efficient Story Point Estimation With Comparative Learning

Authors:Monoshiz Mahbub Khan, Xioayin Xi, Andrew Meneely, Zhe Yu
摘要: 故事点估算敏捷软件开发的重要组成部分。 故事点是无单位的、项目特定的努力估算,有助于开发人员规划他们的冲刺。 传统上,开发人员使用计划扑克或其他手动技术进行协作估算故事点。 虽然将估算与每个项目进行初始校准是有帮助的,但一旦团队达成一组先例,故事点估算可能会变得乏味且耗时。 机器学习可以减轻这种负担,但需要从项目团队的历史决策中获得足够的上下文。 也就是说,最先进的模型,如GPT2SP和FastText-SVM,只有在使用同一项目的数据进行训练时,才能在项目内做出准确的预测。 本研究的目标是通过评估一种基于比较学习的框架来简化故事点估算,以校准项目特定的故事点预测模型。 开发人员不是为每个待办事项分配特定的故事点值,而是会看到成对的事项,并指出哪个事项需要更多的努力。 利用这些比较判断,训练一个机器学习模型来预测故事点估算。 我们使用包含16个项目中23,313个手动估算的数据对我们的技术进行了实证评估。 从比较判断中学习的模型平均可以达到0.34 斯皮尔曼等级相关系数,其预测与真实故事点之间。 这与基于真实故事点学习的回归模型的性能相似,甚至可能更好。 因此,根据比较判断定律,所提出的比较学习方法比最先进的基于回归的方法更高效——提供比较判断比提供评分或分类标签对人类的认知负担更小。
摘要: Story point estimation is an essential part of agile software development. Story points are unitless, project-specific effort estimates that help developers plan their sprints. Traditionally, developers estimate story points collaboratively using planning poker or other manual techniques. While the initial calibrating of the estimates to each project is helpful, once a team has converged on a set of precedents, story point estimation can become tedious and labor-intensive. Machine learning can reduce this burden, but only with enough context from the historical decisions made by the project team. That is, state-of-the-art models, such as GPT2SP and FastText-SVM, only make accurate predictions (within-project) when trained on data from the same project. The goal of this work is to streamline story point estimation by evaluating a comparative learning-based framework for calibrating project-specific story point prediction models. Instead of assigning a specific story point value to every backlog item, developers are presented with pairs of items, and indicate which item requires more effort. Using these comparative judgments, a machine learning model is trained to predict the story point estimates. We empirically evaluated our technique using data with 23,313 manual estimates in 16 projects. The model learned from comparative judgments can achieve on average 0.34 Spearman's rank correlation coefficient between its predictions and the ground truth story points. This is similar to, if not better than, the performance of a regression model learned from the ground truth story points. Therefore, the proposed comparative learning approach is more efficient than state-of-the-art regression-based approaches according to the law of comparative judgments - providing comparative judgments yields a lower cognitive burden on humans than providing ratings or categorical labels.
主题: 人工智能 (cs.AI) ; 软件工程 (cs.SE)
引用方式: arXiv:2507.14642 [cs.AI]
  (或者 arXiv:2507.14642v1 [cs.AI] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.14642
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Monoshiz Mahbub Khan [查看电子邮件]
[v1] 星期六, 2025 年 7 月 19 日 14:36:19 UTC (806 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.SE

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号