Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.09089

帮助 | 高级搜索

计算机科学 > 人工智能

arXiv:2507.09089 (cs)
[提交于 2025年7月12日 ]

标题: 测量早期2025年人工智能对经验丰富的开源开发者生产力的影响

标题: Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

Authors:Joel Becker, Nate Rush, Elizabeth Barnes, David Rein
摘要: 尽管广泛采用,人工智能工具对实际软件开发的影响仍研究不足。我们进行了一项随机对照试验(RCT),以了解2025年2月至6月前沿的人工智能工具如何影响有经验的开源开发人员的生产力。16名具有中等人工智能经验的开发人员在他们平均有5年之前经验的成熟项目中完成了246项任务。每项任务都被随机分配以允许或不允许使用2025年初的人工智能工具。当允许使用人工智能工具时,开发人员主要使用Cursor Pro,这是一种流行的代码编辑器,以及Claude 3.5/3.7 Sonnet。在开始任务之前,开发人员预测允许使用人工智能将减少完成时间24%。完成研究后,开发人员估计允许使用人工智能将减少完成时间20%。令人惊讶的是,我们发现允许使用人工智能实际上增加了完成时间19%——人工智能工具使开发人员变慢了。这种减速也与经济学专家(39%更短)和机器学习专家(38%更短)的预测相矛盾。为了理解这一结果,我们收集并评估了20个可能对观察到的减速效应有贡献的设置属性的证据——例如,项目的规模和质量标准,或者开发人员之前使用人工智能工具的经验。虽然无法完全排除实验人工制品的影响,但减速效应在我们的分析中的稳健性表明,这不太可能是我们的实验设计的主要功能。
摘要: Despite widespread adoption, the impact of AI tools on software development in the wild remains understudied. We conduct a randomized controlled trial (RCT) to understand how AI tools at the February-June 2025 frontier affect the productivity of experienced open-source developers. 16 developers with moderate AI experience complete 246 tasks in mature projects on which they have an average of 5 years of prior experience. Each task is randomly assigned to allow or disallow usage of early 2025 AI tools. When AI tools are allowed, developers primarily use Cursor Pro, a popular code editor, and Claude 3.5/3.7 Sonnet. Before starting tasks, developers forecast that allowing AI will reduce completion time by 24%. After completing the study, developers estimate that allowing AI reduced completion time by 20%. Surprisingly, we find that allowing AI actually increases completion time by 19%--AI tooling slowed developers down. This slowdown also contradicts predictions from experts in economics (39% shorter) and ML (38% shorter). To understand this result, we collect and evaluate evidence for 20 properties of our setting that a priori could contribute to the observed slowdown effect--for example, the size and quality standards of projects, or prior developer experience with AI tooling. Although the influence of experimental artifacts cannot be entirely ruled out, the robustness of the slowdown effect across our analyses suggests it is unlikely to primarily be a function of our experimental design.
评论: 50页,8张表,22幅图
主题: 人工智能 (cs.AI) ; 人机交互 (cs.HC); 软件工程 (cs.SE)
ACM 类: I.2
引用方式: arXiv:2507.09089 [cs.AI]
  (或者 arXiv:2507.09089v1 [cs.AI] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.09089
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: David Rein [查看电子邮件]
[v1] 星期六, 2025 年 7 月 12 日 00:16:33 UTC (15,206 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.HC
cs.SE

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号