Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.03714

帮助 | 高级搜索

计算机科学 > 人机交互

arXiv:2508.03714 (cs)
[提交于 2025年7月23日 ]

标题: “先思考,总验证”:训练人类应对AI风险

标题: "Think First, Verify Always": Training Humans to Face AI Risks

Authors:Yuksel Aydin
摘要: 人工智能使人类认知面临前所未有的攻击,但网络安全仍然主要以设备为中心。 本文介绍了“先思考,始终验证”(TFVA) 协议,该协议将人类重新定位为“防火墙零”,即对抗人工智能威胁的第一道防线。 该协议基于五个操作原则:意识、诚信、判断、伦理责任和透明度(AIJET)。 一项随机对照试验(n=151)表明,一个最小的3分钟干预措施显著提高了认知安全任务的表现,参与者相比对照组表现出绝对+7.87%的提升。 这些结果表明,简短的原则性培训可以迅速增强人类对人工智能驱动的认知操控的抵抗力。 我们建议GenAI平台将“先思考,始终验证”作为标准提示,用可操作的协议取代被动警告,以提高可信和道德的人工智能使用。 通过弥合技术网络安全与人为因素之间的差距,TFVA 协议确立了以人为本的安全性作为可信人工智能系统的重要组成部分。
摘要: Artificial intelligence enables unprecedented attacks on human cognition, yet cybersecurity remains predominantly device-centric. This paper introduces the "Think First, Verify Always" (TFVA) protocol, which repositions humans as 'Firewall Zero', the first line of defense against AI-enabled threats. The protocol is grounded in five operational principles: Awareness, Integrity, Judgment, Ethical Responsibility, and Transparency (AIJET). A randomized controlled trial (n=151) demonstrated that a minimal 3-minute intervention produced statistically significant improvements in cognitive security task performance, with participants showing an absolute +7.87% gains compared to controls. These results suggest that brief, principles-based training can rapidly enhance human resilience against AI-driven cognitive manipulation. We recommend that GenAI platforms embed "Think First, Verify Always" as a standard prompt, replacing passive warnings with actionable protocols to enhance trustworthy and ethical AI use. By bridging the gap between technical cybersecurity and human factors, the TFVA protocol establishes human-empowered security as a vital component of trustworthy AI systems.
主题: 人机交互 (cs.HC) ; 人工智能 (cs.AI); 密码学与安全 (cs.CR); 计算机与社会 (cs.CY)
引用方式: arXiv:2508.03714 [cs.HC]
  (或者 arXiv:2508.03714v1 [cs.HC] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.03714
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Yuksel Aydin [查看电子邮件]
[v1] 星期三, 2025 年 7 月 23 日 19:59:08 UTC (704 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.HC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.AI
cs.CR
cs.CY

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号