开源AI模型正在缩小与闭源实验室差距的说法,是一个听起来令人欣慰的叙事,但数据并不支持这一结论。差距之所以持续存在,不是因为开源研究缺乏人才或算力,而是因为主导开源开发的激励机制,根本不奖励闭源实验室那种不遗余力的护城河构建。
这是对2026年中期能力扩展曲线进行仔细审视后得出的令人不安的结论。根据Interconnects的分析,一个"令人惊讶"的事实是:尽管理论上算力差距应该扩大,但顶级闭源模型并未展现出相对于开源替代品的优势。这意味着,如果算力是唯一变量,分化本应加速,但实际上却趋于稳定——只是没有逆转。
原因在于结构,而非技术。开源模型实验室确实善于在既定基准测试上匹配闭源竞争对手。这不是小成就,反映了充足人才和战略性算力部署的结合。中国开源权重实验室将这一动态推向了极致,大举投资基准测试成绩,以提升融资能力和采用率。在你的吸引力取决于展示对等或优势的语境下,维持"正在追赶"的叙事在商业上是理性的。
但基准测试衡量的是可测量的东西。闭源模型保持着难以量化的品质,这些品质在这些评估中仍然隐形——当知识工作者提出新挑战时至关重要的鲁棒性,将临时用户转化为日常依赖者的通用实用性。这些正是构建持久竞争优势的品质。你无法蒸馏你感知不到的东西,也无法复制你观察不到的东西。
蒸馏——从闭源模型提取能力以改进开源模型——确实有价值,但不能替代构建原创能力。它允许在既定领域快速跟进,但不能进行前沿探索。中国大模型公司从中受益,但Interconnects指出,这些动态的变化"不会是能力平衡的决定性因素"。护城河建立在别处。
需求侧的故事加剧了这种动态。组织、个人和国家确实想要开源模型。这种需求是真实的且在增长。但需求与供应已经脱钩。供应仍由经济因素决定——具体而言,取决于发布模型是增强还是削弱公司的竞争地位。闭源实验室只在服务战略目的时发布模型:获取生态价值、建立标准或预防监管威胁。他们不会发布可能消除自身优势的模型。
结果是形成稳定的均衡,回头看不应令人惊讶。开源模型将继续在可衡量、既定任务上缩小差距。它们将继续在基准测试无法捕捉的高价值应用领域落后。"正在追赶"的框架暗示了一条不存在的终点线,因为终点线在不断移动。闭源实验室在开源模型进步时并未停滞——他们以同样的速度在基准测试无法触及的领域建立新的护城河。
这并不意味着开源模型不重要。它们为自主性、可审计性和成本优化等关键需求服务。但预期开源开发最终会在AI最高价值应用最重要的方面实现对等,误读了两个生态系统的激励架构。差距是结构性的。除非开源研究的激励机制发生变化,开始奖励前沿能力建设而非基准优化,否则曲线将保持平缓。