研究综合自 1 个来源

开源模型追赶闭源的路还很长

要点

• 差距持续因结构性激励，非人才或算力短缺
• 闭源模型持有基准测试无法捕捉的不可量化优势
• 蒸馏实现快速跟进但无法实现前沿探索
• 开源模型需求存在但供应仍由经济因素决定
• 基准对等不等于高端用例中的能力对等

参考来源 (1)

[1] 分析：开源模型与闭源差距难消 — Interconnects ↗

开源AI模型正在缩小与闭源实验室差距的说法，是一个听起来令人欣慰的叙事，但数据并不支持这一结论。差距之所以持续存在，不是因为开源研究缺乏人才或算力，而是因为主导开源开发的激励机制，根本不奖励闭源实验室那种不遗余力的护城河构建。

这是对2026年中期能力扩展曲线进行仔细审视后得出的令人不安的结论。根据Interconnects的分析，一个"令人惊讶"的事实是：尽管理论上算力差距应该扩大，但顶级闭源模型并未展现出相对于开源替代品的优势。这意味着，如果算力是唯一变量，分化本应加速，但实际上却趋于稳定——只是没有逆转。

原因在于结构，而非技术。开源模型实验室确实善于在既定基准测试上匹配闭源竞争对手。这不是小成就，反映了充足人才和战略性算力部署的结合。中国开源权重实验室将这一动态推向了极致，大举投资基准测试成绩，以提升融资能力和采用率。在你的吸引力取决于展示对等或优势的语境下，维持"正在追赶"的叙事在商业上是理性的。

但基准测试衡量的是可测量的东西。闭源模型保持着难以量化的品质，这些品质在这些评估中仍然隐形——当知识工作者提出新挑战时至关重要的鲁棒性，将临时用户转化为日常依赖者的通用实用性。这些正是构建持久竞争优势的品质。你无法蒸馏你感知不到的东西，也无法复制你观察不到的东西。

蒸馏——从闭源模型提取能力以改进开源模型——确实有价值，但不能替代构建原创能力。它允许在既定领域快速跟进，但不能进行前沿探索。中国大模型公司从中受益，但Interconnects指出，这些动态的变化"不会是能力平衡的决定性因素"。护城河建立在别处。

需求侧的故事加剧了这种动态。组织、个人和国家确实想要开源模型。这种需求是真实的且在增长。但需求与供应已经脱钩。供应仍由经济因素决定——具体而言，取决于发布模型是增强还是削弱公司的竞争地位。闭源实验室只在服务战略目的时发布模型：获取生态价值、建立标准或预防监管威胁。他们不会发布可能消除自身优势的模型。

结果是形成稳定的均衡，回头看不应令人惊讶。开源模型将继续在可衡量、既定任务上缩小差距。它们将继续在基准测试无法捕捉的高价值应用领域落后。"正在追赶"的框架暗示了一条不存在的终点线，因为终点线在不断移动。闭源实验室在开源模型进步时并未停滞——他们以同样的速度在基准测试无法触及的领域建立新的护城河。

这并不意味着开源模型不重要。它们为自主性、可审计性和成本优化等关键需求服务。但预期开源开发最终会在AI最高价值应用最重要的方面实现对等，误读了两个生态系统的激励架构。差距是结构性的。除非开源研究的激励机制发生变化，开始奖励前沿能力建设而非基准优化，否则曲线将保持平缓。