高德ABot在AGIBot全球挑战赛上夺冠的同一天,英伟达的机器人研究负责人宣称这一技术路线已经走到尽头。这种荒诞的并置,暴露了一个正在分裂的行业。
ABot以0.829分的成绩摘得2026年5月9日AGIBot全球挑战赛的冠军,其团队投入数月打磨的具身AI技术获得认可。该系统能够导航物理空间、解读视觉环境并执行多步骤任务——这些都是Vision-Language-Action模型架构的标志性能力。
然后Jim Fan出手了。这位英伟达机器人AI高级研究员抛出了被业界迅速冠以"新暴论"的观点:VLA模型已死,遥操系统也已死。AutoNavi团队赖以夺冠的基础技术,在Fan看来毫无未来。
时间点耐人寻味。一支中国团队正在庆祝基于英伟达研究员已宣判死刑的技术取得的突破。这不仅仅是学术分歧——它揭示了一个在最基础问题上缺乏共识的领域。
Fan阵营的支持者指向VLA模型触及的天花板。这些系统难以泛化到训练环境之外。在A仓库能分拣包裹的机器人,换到布局略有不同的B仓库往往完全失效。对于大规模工业部署而言,这种脆弱性是致命的。Fan认为,答案在于另一条路——让基础模型从仿真中学习物理规律,而非模仿人类操作者。
ABot的成绩给出了相反的信号。0.829分在AGIBot基准测试中不是对竞争对手的微弱领先,而是实质性的差距,来自于具身AI系统的渐进式改进。中国机器人界在这条技术路线上下注颇深,将资源倾斜给能够落地VLA架构的团队。
这种分歧给夹在中间的从业者带来现实困境。创业公司需要现在就选定架构。投资人在为机器人公司下注时,需要押注赢家。然而这个领域最响亮的声音在五年后哪种方法会胜出这一根本问题上都无法达成一致。
冲突不止于学术层面。英伟达控制着关键基础设施——GPU芯片、仿真平台、开发者框架——无论各团队选择什么架构,都离不开它。当Fan宣告某条技术路线死亡,他实际上影响着哪种方案会获得关注、资金和工程人才。讽刺的是,像AutoNavi这样的团队仍需依赖英伟达硬件来运行他们的系统,哪怕英伟达自己的研究员声称他们的方法注定失败。
ABot的胜利实际上证明了什么,比任何一方承认的更难定论。这个分数证明了当前VLA系统在特定基准上的表现,却无法证明这些系统能够扩展到真实世界部署。同样,Fan的批评指出了真实的局限,却没有证明他青睐的替代方案能在商业规模上解决这些问题。
机器人界发现自己处于熟悉的境地:最响亮的声音做出的自信预测,与实际结果的混乱现实相撞。今天赢得竞赛的中国团队不会等待英伟达的祝福。真正的问题是,如果终点线不断移动,他们的先发优势还能否算数。