计算机科学 > 计算与语言
[提交于 2023年11月24日
]
标题: 性别推断:chatGPT能否超越常见的商业工具?
标题: Gender inference: can chatGPT outperform common commercial tools?
摘要: 越来越多的研究使用性别信息来理解诸如性别偏见、获取和参与的不平等或新冠疫情影响等现象。 不幸的是,大多数数据集不包含自我报告的性别信息,这使得研究人员必须从其他信息中推断性别,例如姓名或姓名和国家信息。 这些工具的一个重要局限性是它们未能适当捕捉到性别存在于非二元尺度上的事实,然而,在各种情境下评估和比较这些工具的表现仍然很重要。 在本文中,我们比较了一个生成式人工智能(AI)工具ChatGPT与三种商业可用的基于列表和机器学习的性别推断工具(Namsor、Gender-API和genderize.io)在一个独特数据集上的表现。 具体来说,我们使用了一个大型奥运运动员数据集,并报告了输入的变化(例如,名字和名字及姓氏,有无国家信息)如何影响其预测的准确性。 我们报告了整体结果以及子集的结果:获奖者与非获奖者、来自最大英语国家的运动员以及来自东亚的运动员。 在这些集合上,我们发现Namsor是最优秀的传统商业可用工具。 然而,ChatGPT的表现至少与Namsor相当,而且在有国家和/或姓氏信息的情况下,特别是在女性样本中,常常优于Namsor。 所有工具在获奖者与非获奖者以及英语国家的名字上的表现更好。 尽管并非为此目的而设计,ChatGPT可能是一个具有成本效益的性别预测工具。 未来,ChatGPT或其他大规模语言模型甚至可能更好地识别自我报告的性别,而不是在二元尺度上报告性别。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.