计算机科学 > 计算与语言
[提交于 2017年3月30日
]
标题: 英语单词流行度的中性进化和几个世纪的更替
标题: Neutral evolution and turnover over centuries of English word popularity
摘要: 我们在这里将中性模型与英语词汇频率和词汇量在群体规模上的演变进行对比,这些数据来自三个世纪的英语书籍年度词汇频率记录。 针对这些数据,我们测试了两种中性模型的静态和动态预测,包括语料库大小与词汇大小之间的关系、频率分布以及这些频率分布内的更替。 尽管一种常用的中性模型无法同时复制所有这些涌现特性,但我们发现修改后的两阶段中性模型能够复制语料库数据的静态和动态特性。 这个两阶段模型旨在代表一个相对较小的英语书籍语料库(群体),类似于一个“正典”,由更广泛作者群体中指数增长的语料库进行采样。 更广泛地说,这种模式——一个较小的中性模型在一个更大的中性模型内部——可以更广泛地表示那些大众注意力集中在文化变体小部分的情况。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.