Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.18839

帮助 | 高级搜索

计算机科学 > 社会与信息网络

arXiv:2501.18839 (cs)
[提交于 2025年1月31日 ]

标题: 社交网络地理全球机器人清单

标题: Social Cyber Geographical Worldwide Inventory of Bots

Authors:Lynnette Hui Xian Ng, Kathleen M. Carley
摘要: 社会网络地理学是通过社会关系在数字网络领域中产生的空间。 在社交媒体生态系统中,交流不仅由于人类互动而发生,还受到算法控制的机器人代理的推动。 大多数研究没有关注机器人的社会网络地理学,因为它们专注于单一国家内的机器人活动。 由于创建机器人使用的是通用编程技术,机器人在全球范围内的普及程度如何? 为了量化全球的机器人活动,我们对2021年冠状病毒疫情期间从X收集的大规模社交媒体数据集进行了多语言和地理空间分析。 这场疫情影响了世界大部分地区,因此成为共同讨论的话题。 我们的数据集包括由约3100万用户生成的约1亿条帖子。 大多数机器人研究只关注英语国家,因为大多数机器人检测算法是为英语设计的。 然而,只有47%的机器人使用英语写作。 为了在我们的机器人检测算法中支持多种语言,我们构建了Multilingual BotBuster,一种多语言机器人检测算法,以识别这个多样化数据集中的机器人。 我们还创建了一个地理定位标识符,以快速确定用户在其描述中所属的国家。 我们的结果表明,机器人似乎可以从一个国家移动到另一个国家,但它们使用的语言相对保持不变。 机器人在与他们自声明的国家归属相关的不同主题上传播叙述。 最后,尽管机器人位置在全球范围内分布多样,但每个国家的机器人比例约为20%。 我们的工作强调了对网络和物理领域进行联合分析的重要性,我们结合这两个领域来清点社交媒体机器人的语言和位置,并理解沟通策略。
摘要: Social Cyber Geography is the space in the digital cyber realm that is produced through social relations. Communication in the social media ecosystem happens not only because of human interactions, but is also fueled by algorithmically controlled bot agents. Most studies have not looked at the social cyber geography of bots because they focus on bot activity within a single country. Since creating a bot uses universal programming technology, bots, how prevalent are these bots throughout the world? To quantify bot activity worldwide, we perform a multilingual and geospatial analysis on a large dataset of social data collected from X during the Coronavirus pandemic in 2021. This pandemic affected most of the world, and thus is a common topic of discussion. Our dataset consists of ~100 mil posts generated by ~31mil users. Most bot studies focus only on English-speaking countries, because most bot detection algorithms are built for the English language. However, only 47\% of the bots write in the English language. To accommodate multiple languages in our bot detection algorithm, we built Multilingual BotBuster, a multi-language bot detection algorithm to identify the bots in this diverse dataset. We also create a Geographical Location Identifier to swiftly identify the countries a user affiliates with in his description. Our results show that bots can appear to move from one country to another, but the language they write in remains relatively constant. Bots distribute narratives on distinct topics related to their self-declared country affiliation. Finally, despite the diverse distribution of bot locations around the world, the proportion of bots per country is about 20%. Our work stresses the importance of a united analysis of the cyber and physical realms, where we combine both spheres to inventorize the language and location of social media bots and understand communication strategies.
主题: 社会与信息网络 (cs.SI)
引用方式: arXiv:2501.18839 [cs.SI]
  (或者 arXiv:2501.18839v1 [cs.SI] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.18839
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Lynnette Hui Xian Ng [查看电子邮件]
[v1] 星期五, 2025 年 1 月 31 日 01:16:05 UTC (6,132 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.SI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号