Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.19806

帮助 | 高级搜索

计算机科学 > 计算机与社会

arXiv:2506.19806 (cs)
[提交于 2025年6月24日 ]

标题: 基于大语言模型的社会模拟需要一个边界

标题: LLM-Based Social Simulations Require a Boundary

Authors:Zengqing Wu, Run Peng, Takayuki Ito, Chuan Xiao
摘要: 本文论述了基于大型语言模型(LLM)的社会模拟应建立明确的边界,以有意义地促进社会科学的研究。 尽管与传统的基于代理的建模相比,LLM在建模类人代理方面表现出令人期待的能力,但它们面临基本的限制,这些限制限制了其在社会模式发现中的可靠性。 核心问题在于LLM倾向于形成“平均人格”,缺乏足够的行为异质性,而这是模拟复杂社会动态的关键要求。 我们考察了三个关键的边界问题:对齐性(模拟行为与现实世界模式相匹配)、一致性(在时间上保持代理行为的一致性)和鲁棒性(在不同条件下具有可重复性)。 我们提出了启发式的边界,以确定何时基于LLM的模拟可以可靠地推进社会科学的理解。 我们认为,当专注于(1)集体模式而非个体轨迹,(2)代理行为与真实人口平均水平一致,尽管方差有限,以及(3)有适当的验证方法用于测试模拟鲁棒性时,这些模拟更具价值。 我们提供了一个实用的检查清单,以指导研究人员确定基于LLM的社会模拟的适当范围和主张。
摘要: This position paper argues that large language model (LLM)-based social simulations should establish clear boundaries to meaningfully contribute to social science research. While LLMs offer promising capabilities for modeling human-like agents compared to traditional agent-based modeling, they face fundamental limitations that constrain their reliability for social pattern discovery. The core issue lies in LLMs' tendency towards an ``average persona'' that lacks sufficient behavioral heterogeneity, a critical requirement for simulating complex social dynamics. We examine three key boundary problems: alignment (simulated behaviors matching real-world patterns), consistency (maintaining coherent agent behavior over time), and robustness (reproducibility under varying conditions). We propose heuristic boundaries for determining when LLM-based simulations can reliably advance social science understanding. We believe that these simulations are more valuable when focusing on (1) collective patterns rather than individual trajectories, (2) agent behaviors aligning with real population averages despite limited variance, and (3) proper validation methods available for testing simulation robustness. We provide a practical checklist to guide researchers in determining the appropriate scope and claims for LLM-based social simulations.
主题: 计算机与社会 (cs.CY) ; 计算与语言 (cs.CL); 多智能体系统 (cs.MA)
引用方式: arXiv:2506.19806 [cs.CY]
  (或者 arXiv:2506.19806v1 [cs.CY] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.19806
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Zengqing Wu [查看电子邮件]
[v1] 星期二, 2025 年 6 月 24 日 17:14:47 UTC (167 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs.CL
cs.CY
cs.MA

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号