计算机科学 > 社会与信息网络
[提交于 2025年9月22日
]
标题: 当生命路径交汇时:从维基百科中提取时间和空间中的人类交互
标题: When Life Paths Cross: Extracting Human Interactions in Time and Space from Wikipedia
摘要: 在著名人物之间的互动——无论是在个体、群体还是网络中进行研究——往往在文化、经济、政治、科学和历史视角下传达重要的信息。 通过分析这些互动的时间和地点,我们可以观察到不同地区随时间推移的动态变化。 然而,相关研究常常受到数据稀缺的限制,尤其是在具体地点和时间信息的可用性方面。 为了解决这个问题,我们从维基百科挖掘了数百万条传记页面,提取了以(Person1,Person2,Time,Location)形式的685,966条互动四元组记录。 这些互动的关键元素通常分散在异构的众包文本中,可能与互动松散或间接相关。 我们通过设计一种结合注意力机制、多任务学习和特征迁移方法的模型,克服了这一挑战,取得了86.51%的F1分数,这优于基线模型。 我们进一步对政治人物内部和跨党派的互动进行了实证分析,以研究美国的政治极化现象,展示了从这种数据中获得的视角可能带来的潜力。 我们公开提供代码、提取的互动数据以及包含4,507个标记互动四元组的WikiInteraction数据集。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.