新加坡某会议中心,三位研究者在台上看到自己的名字——不是作为演讲者,而是作为ICLR十年时间检验奖的获奖者。其中两人当年参与构建GPT时还是本科生。第三位则在进入LeCun门下之前,只是一所普通高校的学生。他们几个月前刚刚在一款名为Mira的创业公司重新聚首。
该奖项表彰十年前发表的最具影响力论文,因其由学术界同行评选而分量十足。当结果揭晓时,业界反应几乎是难以置信:过去十年最具影响力的AI论文,竟出自一支名不见经传的团队,而非明星实验室。
2016年论文发表时,这几位作者还是无名之辈。一位是哲学专业出身,一位学心理学。他们在OpenAI亚历克·雷福德手下工作,没有机构背书,没有庞大的算力预算——只有一个问题:如果扩大语言模型的规模,会发生什么?
这篇关于Scaling Law的论文成为GPT开发的理论基础。研究发现——模型性能随数据量和算力可预测提升——指导了此后所有主流语言模型的发展。这些原则在近十年间始终是行业金科玉律。
第三位作者陈志成(化名)走了另一条路。进入一所地方院校——按精英实验室标准属于"普通高校"——后,他因在神经网络优化方面的研究引起了LeCun的注意。LeCun邀请他加入纽约大学的实验室。陈成为少数几位以非顶尖院校背景在LeCun指导下发表奠基性成果的学生之一。
三人最终都离开学术界进入产业界。两位本科退学加入OpenAI,陈离开LeCun的实验室去了科技公司。2024年,因缘际会三人在Mira再次合作,研发他们所说的"面向大众的前沿AI"。
奖项揭露出一个令机构难堪的事实:前沿AI开发需要大批博士和数十亿算力的说法或许站不住脚。陈的求学经历尤其打破了主导大厂招聘的阶层壁垒。当精英项目争抢清华、北大、麻省理工毕业生时,陈证明了能力比出身更重要。
学术界同行的判断很明确:过去十年最重要的AI论文,出自三位不符合标准模板的人。在这个行业沉迷于越来越大模型和庞大规模研发联盟的时刻,他们的故事提醒着——下一个突破可能来自任何地方——包括一位哲学专业学生和一位心理学学生,他们只是单纯想知道扩大规模后会发生什么。