计算机科学 > 人工智能
[提交于 2025年1月10日
(v1)
,最后修订 2025年7月10日 (此版本, v3)]
标题: AI伦理形式验证的规范时间逻辑
标题: Deontic Temporal Logic for Formal Verification of AI Ethics
摘要: 确保在人工智能(AI)系统日益普遍和影响力扩大的情况下保持伦理行为是全球关注的重大问题。 在AI伦理中使用形式化方法可能是指定和验证AI系统伦理行为的关键方法。 本文提出了一种基于义务逻辑的形式化方法,用于定义和评估AI系统的伦理行为,重点在于系统级规范,为实现这一重要目标做出贡献。 它引入了公理和定理来捕捉与公平性和可解释性相关的伦理要求。 该形式化方法结合了时间算子,以推理AI系统随时间变化的伦理行为。 作者通过评估现实世界中的COMPAS和贷款预测AI系统的伦理来验证这种形式化方法的有效性。 使用义务逻辑公式对COMPAS和贷款预测系统的各种伦理属性进行编码,从而可以使用自动定理证明器验证这些系统是否满足定义的属性。 形式化验证表明,这两个系统未能满足与公平性和非歧视相关的某些关键伦理属性,这证明了所提出的形式化方法在识别现实世界AI应用中潜在伦理问题方面的有效性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.