计算机科学 > 计算与语言
[提交于 2025年4月15日
]
标题: 播客和大型语言模型中的性别化话语中的男性默认设置
标题: Masculine Defaults via Gendered Discourse in Podcasts and Large Language Models
摘要: 男性默认值被广泛认为是一种重要的性别偏见,但它们往往未被察觉,因为研究不足。 男性默认值包括三个关键部分:(i) 文化背景,(ii) 男性特征或行为,以及 (iii) 对这些男性特征或行为的奖励或仅仅是接受。 在本工作中,我们研究基于话语的男性默认值,并提出了一个两部分框架:(i) 通过我们的性别话语相关框架(GDCF)大规模发现和分析口语内容中的性别化话语词;以及 (ii) 通过我们的话语词嵌入关联测试(D-WEAT)测量这些性别化话语词与大型语言模型(LLMs)相关的性别偏见。 我们专注于播客,这是一种流行且不断增长的社交媒体形式,分析了15,117个播客节目。 我们分析了性别与话语词之间的相关性——通过LDA和BERTopic发现的——以自动生成性别化话语词列表。 然后,我们研究了这些性别化话语词在特定领域背景中的普遍性,并发现基于性别化话语的男性默认值存在于商业、技术和政治以及视频游戏领域。 接下来,我们研究了来自OpenAI的一个最先进的LLM嵌入模型中这些性别化话语词的表示,并发现男性话语词比女性话语词具有更稳定和稳健的表示,这可能导致在下游任务中对男性有更好的系统性能。 因此,男性因他们的话语模式而得到更好的系统性能,这是由一个最先进的语言模型带来的——这种嵌入差异是一种表征伤害和男性默认值。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.