Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2504.11431

帮助 | 高级搜索

计算机科学 > 计算与语言

arXiv:2504.11431 (cs)
[提交于 2025年4月15日 ]

标题: 播客和大型语言模型中的性别化话语中的男性默认设置

标题: Masculine Defaults via Gendered Discourse in Podcasts and Large Language Models

Authors:Maria Teleki, Xiangjue Dong, Haoran Liu, James Caverlee
摘要: 男性默认值被广泛认为是一种重要的性别偏见,但它们往往未被察觉,因为研究不足。 男性默认值包括三个关键部分:(i) 文化背景,(ii) 男性特征或行为,以及 (iii) 对这些男性特征或行为的奖励或仅仅是接受。 在本工作中,我们研究基于话语的男性默认值,并提出了一个两部分框架:(i) 通过我们的性别话语相关框架(GDCF)大规模发现和分析口语内容中的性别化话语词;以及 (ii) 通过我们的话语词嵌入关联测试(D-WEAT)测量这些性别化话语词与大型语言模型(LLMs)相关的性别偏见。 我们专注于播客,这是一种流行且不断增长的社交媒体形式,分析了15,117个播客节目。 我们分析了性别与话语词之间的相关性——通过LDA和BERTopic发现的——以自动生成性别化话语词列表。 然后,我们研究了这些性别化话语词在特定领域背景中的普遍性,并发现基于性别化话语的男性默认值存在于商业、技术和政治以及视频游戏领域。 接下来,我们研究了来自OpenAI的一个最先进的LLM嵌入模型中这些性别化话语词的表示,并发现男性话语词比女性话语词具有更稳定和稳健的表示,这可能导致在下游任务中对男性有更好的系统性能。 因此,男性因他们的话语模式而得到更好的系统性能,这是由一个最先进的语言模型带来的——这种嵌入差异是一种表征伤害和男性默认值。
摘要: Masculine defaults are widely recognized as a significant type of gender bias, but they are often unseen as they are under-researched. Masculine defaults involve three key parts: (i) the cultural context, (ii) the masculine characteristics or behaviors, and (iii) the reward for, or simply acceptance of, those masculine characteristics or behaviors. In this work, we study discourse-based masculine defaults, and propose a twofold framework for (i) the large-scale discovery and analysis of gendered discourse words in spoken content via our Gendered Discourse Correlation Framework (GDCF); and (ii) the measurement of the gender bias associated with these gendered discourse words in LLMs via our Discourse Word-Embedding Association Test (D-WEAT). We focus our study on podcasts, a popular and growing form of social media, analyzing 15,117 podcast episodes. We analyze correlations between gender and discourse words -- discovered via LDA and BERTopic -- to automatically form gendered discourse word lists. We then study the prevalence of these gendered discourse words in domain-specific contexts, and find that gendered discourse-based masculine defaults exist in the domains of business, technology/politics, and video games. Next, we study the representation of these gendered discourse words from a state-of-the-art LLM embedding model from OpenAI, and find that the masculine discourse words have a more stable and robust representation than the feminine discourse words, which may result in better system performance on downstream tasks for men. Hence, men are rewarded for their discourse patterns with better system performance by one of the state-of-the-art language models -- and this embedding disparity is a representational harm and a masculine default.
评论: 将出现在ICWSM 2025上
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI); 计算机与社会 (cs.CY); 机器学习 (cs.LG); 社会与信息网络 (cs.SI)
引用方式: arXiv:2504.11431 [cs.CL]
  (或者 arXiv:2504.11431v1 [cs.CL] 对于此版本)
  https://doi.org/10.48550/arXiv.2504.11431
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Maria Teleki [查看电子邮件]
[v1] 星期二, 2025 年 4 月 15 日 17:41:54 UTC (1,430 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-04
切换浏览方式为:
cs.AI
cs.CL
cs.CY
cs.LG
cs.SI

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号