研究综合自 1 个来源

三个退学生捧走AI十年里程碑奖

要点

参考来源 (1)

新加坡某会议中心，三位研究者在台上看到自己的名字——不是作为演讲者，而是作为ICLR十年时间检验奖的获奖者。其中两人当年参与构建GPT时还是本科生。第三位则在进入LeCun门下之前，只是一所普通高校的学生。他们几个月前刚刚在一款名为Mira的创业公司重新聚首。

该奖项表彰十年前发表的最具影响力论文，因其由学术界同行评选而分量十足。当结果揭晓时，业界反应几乎是难以置信：过去十年最具影响力的AI论文，竟出自一支名不见经传的团队，而非明星实验室。

2016年论文发表时，这几位作者还是无名之辈。一位是哲学专业出身，一位学心理学。他们在OpenAI亚历克·雷福德手下工作，没有机构背书，没有庞大的算力预算——只有一个问题：如果扩大语言模型的规模，会发生什么？

这篇关于Scaling Law的论文成为GPT开发的理论基础。研究发现——模型性能随数据量和算力可预测提升——指导了此后所有主流语言模型的发展。这些原则在近十年间始终是行业金科玉律。

第三位作者陈志成（化名）走了另一条路。进入一所地方院校——按精英实验室标准属于"普通高校"——后，他因在神经网络优化方面的研究引起了LeCun的注意。LeCun邀请他加入纽约大学的实验室。陈成为少数几位以非顶尖院校背景在LeCun指导下发表奠基性成果的学生之一。

三人最终都离开学术界进入产业界。两位本科退学加入OpenAI，陈离开LeCun的实验室去了科技公司。2024年，因缘际会三人在Mira再次合作，研发他们所说的"面向大众的前沿AI"。

奖项揭露出一个令机构难堪的事实：前沿AI开发需要大批博士和数十亿算力的说法或许站不住脚。陈的求学经历尤其打破了主导大厂招聘的阶层壁垒。当精英项目争抢清华、北大、麻省理工毕业生时，陈证明了能力比出身更重要。

学术界同行的判断很明确：过去十年最重要的AI论文，出自三位不符合标准模板的人。在这个行业沉迷于越来越大模型和庞大规模研发联盟的时刻，他们的故事提醒着——下一个突破可能来自任何地方——包括一位哲学专业学生和一位心理学学生，他们只是单纯想知道扩大规模后会发生什么。