Nature和施普林格·自然(Springer Nature)在同一天先后撤下一篇声称ChatGPT对学生学习成绩有显著正向影响的荟萃分析论文——这标志着同行评审机制遭遇了一次系统性溃败。
被撤论文的作者是来自杭州师范大学的金王(Jin Wang)和范文祥(Wenxiang Fan),标题为《ChatGPT对学生学习成绩、学习感知及高阶思维的影响:基于荟萃分析的见解》。该论文于2025年5月发表,分析了2022年11月至2025年2月间发表的51项研究,得出结论:ChatGPT对学生这三项指标均具有"较大或中等程度的正向影响"。撤稿前,该论文已被引用数百次,并在社交媒体上广泛传播,被视为生成式AI教育应用领域的"黄金标准"证据。
爱丁堡大学数字教育研究中心高级讲师本·威廉姆森(Ben Williamson)指出,学界和社会对这一结论的接受速度远超正常水平——它被视为证明ChatGPT及更广泛生成式AI确实有益于学习的首批硬证据。然而,就在学术界为此欢欣鼓舞之际,施普林格·自然和Nature均以"分析存在差异"及"对结论缺乏信心"为由宣布撤稿。
这一事件暴露出同行评审在面对AI行业叙事时的深层脆弱性。荟萃分析的质量完全取决于其纳入的底层研究质量。如果这51项研究本身存在方法论缺陷、选择性报告或发表偏倚——这些都是教育研究领域公认的问题——那么无论数据如何整合,结论都将站不住脚。同行评审要么未能识别这些隐患,要么选择了放行。
更深层的问题在于,随着AI厂商大举进军教育市场,学术期刊面临 Publish or Perish(发表或出局)的压力,市场对"AI有效"结论的渴望与期刊的发表激励形成了危险的共振。当两家顶级出版机构在不到一周内撤下内容高度相似的论文时,问题显然已不是偶发的编辑失察,而是结构性的系统失灵。
那些曾基于这项"黄金标准"研究大规模推广AI教学工具的教育工作者,如今陷入尴尬境地。科学记录显示,同行评审未能识破披着荟萃分析外衣的AI宣传。ChatGPT究竟能否真正提升学习效果,这个根本问题依然悬而未决。