物理学 > 物理教育
[提交于 2025年8月12日
]
标题: 物理学教育的青蛙沸腾问题
标题: The Boiling-Frog Problem of Physics Education
摘要: 令人惊讶的是,通用人工智能在基础物理中迅速跨越了熟悉的门槛。 比较连续模型的输出, GPT-5 思维远远超越了早期的套用公式倾向:在一个经典的电梯问题中,它进行符号运算,注意变量何时抵消,并验证结果;试图提示类似新手的行为主要影响语气,而不是方法。 在表示转换方面,该模型在 TUG-Kv4.0 上得分为 24/26(92.3%)。 在使用我的两份综合期末考试(60 个项目)作为卡片分类代理时,其分类反映了求解方法,而不是表面特征。 解决这些相同的考试,它得到 27/30 和 25/30,大部分错误出现在基于尺子的光路绘制和电路解释上。 在认识论方面,五次独立的 CLASS 运行得出 100% 的积极结果,表明一种模拟专家的立场。 以“青蛙煮沸”问题的形式,本文主张采取决定性行动:停止有学分的非监督封闭式在线评估;评估过程证据;使用纸张、白板;将权重转移到建模、数据和真实实验;要求透明、可引用的人工智能使用;重新构建问题类型;并依靠基于研究的教学和同伴学习。 机会在于突出人工智能无法替代的东西:对世界的建模,从证据中论证,以及做出有原则的近似。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.