"土豆"预训练项目不是意外泄露。这是战略性的、蓄意的、在AI行业最需要听到它的时刻精准释放的信号。
OpenAI上周同时披露的神秘"土豆"架构和GPT-6路线图,在数小时内相继曝光,时机之精准不可能是巧合。这家对每个模型发布都守口如瓶的公司,突然主动放出两条重磅信息:一种绕过传统扩展法则的新预训练方法,以及确认GPT-6将直接对标AGI基准。信息的主要受众不是研究人员或开发者——而是投资者、企业客户,以及至关重要的Anthropic。
战略布局的意图很明确:OpenAI正在抢在他人书写故事之前控制叙事。Anthropic一直以安全优先的定位自居,凭借这一立场赢得了企业合同和政府合作。但市场需要的是更直观的东西——证明前沿仍在推进,下一个能力跃升来自某个特定来源。通过预披露GPT-6的AGI野心,OpenAI实际上将期望值设得极高,任何竞争发布都将成为比较对象,而非替代选项。
"土豆"泄露则服务于另一个功能。它暗示OpenAI已找到更高效训练模型的方法——可能绕过困扰GPT-5的收益递减问题,迫使竞争对手只能增量发布。如果属实,这可以解释为什么视频生成模型Sora被悄悄边缘化:资源正在重新定向到基础模型突破,而非应用层产品。这是公司战略的重大转向。
Anthropic的处境更加艰难。其Claude系列凭借推理能力和安全研究赢得了尊重,但市场奖励的是原始能力的首发者。如果OpenAI成功将GPT-6定位为"AGI模型",Anthropic必须拿出可比的声明来回应——这需要达到或超越尚不存在的基准——否则就只能接受二线定位,损失数十亿美元的企业合同。
OpenAI赌的是:在AI竞赛中,认知会自我强化。被视为具备AGI能力的模型,会吸引研究人才、算力资源和监管善意,使AGI成为可能。公司不需要GPT-6真正实现通用人工智能,只需要市场相信它会实现,然后让这种信念塑造未来18个月的投资与合作关系。
换句话说,泄露本身就是行动。其他一切——基准测试、能力演示、最终发布——都只是收尾动作。