计算机科学 > 计算与语言
[提交于 2023年12月1日
]
标题: 质疑案例判断摘要中的偏见:法律数据集还是大型语言模型?
标题: Questioning Biases in Case Judgment Summaries: Legal Datasets or Large Language Models?
摘要: 法律数据集的演变和大型语言模型(LLMs)的出现极大地改变了法律领域,尤其是在案件判决摘要的生成方面。然而,一个关键的问题是这些摘要中可能存在的偏见。本研究审查了法律数据集和大型语言模型产生的案件判决摘要中的偏见。研究旨在分析偏见对法律决策的影响。通过质疑这些摘要中偏见的准确性、公平性和影响,本研究有助于更好地理解技术在法律环境中的作用以及对全球司法系统的影响。在本研究中,我们调查了与性别相关关键词、与种族相关关键词、针对女性犯罪的相关关键词、国家名称和宗教相关关键词相关的偏见。研究表明,大型语言模型和预训练的抽象摘要模型生成的输出中存在有趣的偏见证据。这些偏见背后的原因需要进一步研究。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.