Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.09051

帮助 | 高级搜索

计算机科学 > 软件工程

arXiv:2507.09051 (cs)
[提交于 2025年7月11日 ]

标题: SAGE:一种从心理健康应用程序中挖掘隐私需求相关评论的上下文感知方法

标题: SAGE: A Context-Aware Approach for Mining Privacy Requirements Relevant Reviews from Mental Health Apps

Authors:Aakash Sorathiya, Gouri Ginde
摘要: 心理健康(MH)应用程序通常需要敏感的用户数据,以针对心理健康需求定制服务。 然而,一些MH应用程序的数据收集实践引发了用户的重大隐私担忧。 这些担忧经常在应用评论中被提及,但其他反馈类别,如可靠性与可用性,往往更为突出。 这给自动识别可用于提取隐私需求并解决用户隐私担忧的隐私需求相关评论(隐私评论)带来了重大挑战。 因此,本研究引入了SAGE,这是一种上下文感知的方法,通过自然语言推理(NLI)从MH应用程序中自动挖掘隐私评论,使用MH领域特定的隐私假设(提供领域特定的上下文感知)和一个GPT模型(无需微调)。 在包含204K条应用评论的数据集上对SAGE进行定量评估,无需任何微调即可达到0.85的F1分数,优于微调的基线分类器BERT和T5。 此外,SAGE提取了748条之前被基于关键词的方法忽略的隐私评论,通过定性评估证明了其有效性。 这些评论随后可以被精炼为可操作的隐私需求文档。
摘要: Mental health (MH) apps often require sensitive user data to customize services for mental wellness needs. However, such data collection practices in some MH apps raise significant privacy concerns for users. These concerns are often mentioned in app reviews, but other feedback categories, such as reliability and usability, tend to take precedence. This poses a significant challenge in automatically identifying privacy requirements-relevant reviews (privacy reviews) that can be utilized to extract privacy requirements and address users' privacy concerns. Thus, this study introduces SAGE, a context-aware approach to automatically mining privacy reviews from MH apps using Natural Language Inference (NLI) with MH domain-specific privacy hypotheses (provides domain-specific context awareness) and a GPT model (eliminates the need for fine-tuning). The quantitative evaluation of SAGE on a dataset of 204K app reviews achieved an F1 score of 0.85 without any fine-tuning, outperforming the fine-tuned baseline classifiers BERT and T5. Furthermore, SAGE extracted 748 privacy reviews previously overlooked by keyword-based methods, demonstrating its effectiveness through qualitative evaluation. These reviews can later be refined into actionable privacy requirement artifacts.
主题: 软件工程 (cs.SE)
引用方式: arXiv:2507.09051 [cs.SE]
  (或者 arXiv:2507.09051v1 [cs.SE] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.09051
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Aakash Sorathiya [查看电子邮件]
[v1] 星期五, 2025 年 7 月 11 日 21:53:56 UTC (267 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.SE
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号