Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.12272

帮助 | 高级搜索

计算机科学 > 社会与信息网络

arXiv:2501.12272 (cs)
[提交于 2025年1月21日 ]

标题: 一种用于争议性话题中用户和关键词分类的轻量级方法

标题: A Lightweight Approach for User and Keyword Classification in Controversial Topics

Authors:Ahmad Zareie, Kalina Bontcheva, Carolina Scarton
摘要: 对有争议话题的立场进行分类并揭示个体的关注点对于社会科学家和政策制定者至关重要。 来自在线社交网络(OSNs)的数据,作为社会代表性样本的代理,提供了一个机会来对这些立场进行分类,发现社会在有争议话题上的关注点,并跟踪这些关注点随时间的变化。 因此,OSNs中的立场分类引起了研究人员的广泛关注。 然而,大多数现有的方法通常依赖于标记数据,并利用用户帖子的内容或用户之间的互动,这需要大量数据、大量的处理时间和对不易获取的信息(例如:用户的关注者/被关注者)的访问。 本文提出了一种轻量级的方法,用于OSNs中用户和关键词的立场分类,旨在理解个体的集体意见及其关注点。 我们的方法采用了一个定制的随机游走模型,只需每个立场的一个关键词,仅使用社交媒体帖子中的关键词。 实验结果表明,与基线方法相比,我们的方法表现出色,在用户和关键词的立场分类方面表现优异,虽然运行时间不是最快的,但仍具有竞争力。
摘要: Classifying the stance of individuals on controversial topics and uncovering their concerns is crucial for social scientists and policymakers. Data from Online Social Networks (OSNs), which serve as a proxy to a representative sample of society, offers an opportunity to classify these stances, discover society's concerns regarding controversial topics, and track the evolution of these concerns over time. Consequently, stance classification in OSNs has garnered significant attention from researchers. However, most existing methods for this task often rely on labelled data and utilise the text of users' posts or the interactions between users, necessitating large volumes of data, considerable processing time, and access to information that is not readily available (e.g. users' followers/followees). This paper proposes a lightweight approach for the stance classification of users and keywords in OSNs, aiming at understanding the collective opinion of individuals and their concerns. Our approach employs a tailored random walk model, requiring just one keyword representing each stance, using solely the keywords in social media posts. Experimental results demonstrate the superior performance of our method compared to the baselines, excelling in stance classification of users and keywords, with a running time that, while not the fastest, remains competitive.
主题: 社会与信息网络 (cs.SI)
引用方式: arXiv:2501.12272 [cs.SI]
  (或者 arXiv:2501.12272v1 [cs.SI] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.12272
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Ahmad Zareie [查看电子邮件]
[v1] 星期二, 2025 年 1 月 21 日 16:42:38 UTC (30 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.SI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号