计算机科学 > 人机交互
[提交于 2025年6月24日
(v1)
,最后修订 2025年6月26日 (此版本, v2)]
标题: HARPT:用于分析移动健康应用程序中消费者信任和隐私担忧的语料库
标题: HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps
摘要: 我们提出HARPT,这是一个大规模标注的移动健康应用商店评论语料库,旨在推动用户隐私和信任方面的研究。 该数据集包含超过480,000条用户评论,分为七个类别,涵盖了应用程序信任、提供者信任和隐私担忧的关键方面。 创建HARPT需要解决多个复杂问题,例如定义细致的标签模式,从大量噪声数据中隔离相关内容,并设计一种在可扩展性与准确性之间取得平衡的标注策略。 该策略整合了基于规则的过滤、迭代的手动标记与审查、针对性的数据增强以及使用基于Transformer的分类器进行弱监督,以加快覆盖速度。 同时,精心挑选的7,000条评论子集被手动标注,以支持模型开发和评估。 我们对一系列分类模型进行了基准测试,证明了高性能是可行的,并为未来的研究提供了基准。 HARPT作为公共资源发布,以支持健康信息学、网络安全和自然语言处理领域的工作。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.