计算机科学 > 计算与语言
[提交于 2025年7月13日
]
标题: Te Ahorré Un Click:点击诱饵的重新定义及西班牙新闻中的检测
标题: Te Ahorré Un Click: A Revised Definition of Clickbait and Detection in Spanish News
摘要: 我们修订了点击诱饵的定义,该定义目前缺乏共识,并认为创造好奇心缺口是区分点击诱饵与其他相关现象(如夸张主义和未兑现承诺或偏离文章内容的标题)的关键概念。因此,我们提出了一个新的定义:点击诱饵是一种生成标题和预告片的技术,故意省略部分信息,以提高读者的好奇心,吸引他们的注意力并诱使他们点击。我们引入了一种新的点击诱饵检测数据集创建方法,通过细化概念范围和注释标准,尽可能减少决策中的主观性。随后,我们创建并发布了TA1C(Te Ahorré Un Click,西班牙语意为Saved You A Click),这是首个用于西班牙语点击诱饵检测的开源数据集。它包含来自18个知名媒体来源的3500条推文,经过人工标注,达到0.825的Fleiss' K评分者间一致性。我们实现了强大的基线模型,F1得分达到0.84。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.