研究综合自 2 个来源

Nature与Springer双撤稿：同行评审为何漏过AI教育宣传

要点

• Nature与施普林格·自然一周内双撤同主题AI教育论文
• 论文作者来自杭州师范大学，引用51项研究，被引数百次
• 出版方以分析存在差异为由撤稿
• 该研究曾被视为ChatGPT学习效果的黄金标准证据
• 据此推广AI教学的教育工作者失去可靠依据

参考来源 (2)

[1] 重磅ChatGPT教育研究因数据问题被撤稿 — Ars Technica AI ↗
[2] 《自然》撤稿ChatGPT学习效果研究 — 404 Media ↗

Nature和施普林格·自然（Springer Nature）在同一天先后撤下一篇声称ChatGPT对学生学习成绩有显著正向影响的荟萃分析论文——这标志着同行评审机制遭遇了一次系统性溃败。

被撤论文的作者是来自杭州师范大学的金王（Jin Wang）和范文祥（Wenxiang Fan），标题为《ChatGPT对学生学习成绩、学习感知及高阶思维的影响：基于荟萃分析的见解》。该论文于2025年5月发表，分析了2022年11月至2025年2月间发表的51项研究，得出结论：ChatGPT对学生这三项指标均具有"较大或中等程度的正向影响"。撤稿前，该论文已被引用数百次，并在社交媒体上广泛传播，被视为生成式AI教育应用领域的"黄金标准"证据。

爱丁堡大学数字教育研究中心高级讲师本·威廉姆森（Ben Williamson）指出，学界和社会对这一结论的接受速度远超正常水平——它被视为证明ChatGPT及更广泛生成式AI确实有益于学习的首批硬证据。然而，就在学术界为此欢欣鼓舞之际，施普林格·自然和Nature均以"分析存在差异"及"对结论缺乏信心"为由宣布撤稿。

这一事件暴露出同行评审在面对AI行业叙事时的深层脆弱性。荟萃分析的质量完全取决于其纳入的底层研究质量。如果这51项研究本身存在方法论缺陷、选择性报告或发表偏倚——这些都是教育研究领域公认的问题——那么无论数据如何整合，结论都将站不住脚。同行评审要么未能识别这些隐患，要么选择了放行。

更深层的问题在于，随着AI厂商大举进军教育市场，学术期刊面临 Publish or Perish（发表或出局）的压力，市场对"AI有效"结论的渴望与期刊的发表激励形成了危险的共振。当两家顶级出版机构在不到一周内撤下内容高度相似的论文时，问题显然已不是偶发的编辑失察，而是结构性的系统失灵。

那些曾基于这项"黄金标准"研究大规模推广AI教学工具的教育工作者，如今陷入尴尬境地。科学记录显示，同行评审未能识破披着荟萃分析外衣的AI宣传。ChatGPT究竟能否真正提升学习效果，这个根本问题依然悬而未决。