计算机科学 > 软件工程
[提交于 2025年7月11日
(v1)
,最后修订 2025年7月20日 (此版本, v2)]
标题: CMER:一种上下文感知的方法用于挖掘与伦理关注相关的应用评论
标题: CMER: A Context-Aware Approach for Mining Ethical Concern-related App Reviews
摘要: 随着移动应用程序在我们日常生活中的日益普及,有关伦理的问题显著增加。 用户在应用评论中表达他们的反馈,经常强调伦理问题,例如隐私和安全。 纳入这些评论已被证明对软件工程的许多领域(例如需求工程、测试等)很有用。 然而,与伦理问题相关的应用评论通常使用特定领域的语言,并且通常被更通用的用户反馈类别(如应用可靠性与可用性)所掩盖。 因此,自动化提取是一项具有挑战性和耗时的工作。 本研究提出了CMER(一种\underline{C}上下文感知方法用于\underline{M}挖掘\underline{E}道德关注相关应用\underline{R}评论),一种结合自然语言推理(NLI)和仅解码器(类似LLaMA)大型语言模型(LLM)的新方法,以大规模提取与道德关注相关应用评论。 在CMER中,NLI通过使用特定领域的假设提供特定领域的上下文意识,而类似LLaMA的LLM则消除了分类任务中对标记数据的需求。 我们通过从超过382K条移动投资类应用评论的数据集中挖掘与隐私和安全相关的评论(PSRs)来评估CMER的有效性。 首先,我们评估了四种NLI模型,并将特定领域的假设结果与通用假设进行比较。 接下来,我们评估了三种LLM在分类任务中的表现。 最后,我们将最佳的NLI和LLM模型(CMER)结合,使用基于关键词的方法提取了2,178条之前研究未注意到的PSRs,从而证明了CMER的有效性。 这些评论可以进一步细化为可操作的需求工件。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.