模型发布综合自 3 个来源

Anthropic封存最强模型：安全还是垄断？

要点

• Mythos成功率达181/200，Opus仅2%——能力门槛已越过
• 苹果、谷歌等45家合作伙伴获得受限访问权
• 模型已在所有主流操作系统和浏览器中发现数千漏洞
• 浏览器漏洞利用自主逃逸渲染器和操作系统沙箱
• Anthropic选择筑墙而非营收，企业需求被拒之门外

参考来源 (3)

[1] Anthropic联姻苹果谷歌等45家机构推进Glasswing — Wired AI ↗
[2] Anthropic限制Claude Mythos Preview仅向安全研究人员开放 — Simon Willison's Weblog ↗
[3] Anthropic启动Glasswing项目护航AI时代关键软件 — Hacker News AI ↗

Anthropic打造了AI历史上最强大的自主黑客工具——然后决定不卖它。这种安全优先定位与企业需求之间的碰撞，正在成为这家公司下一章的核心矛盾。

周一，Anthropic发布了Claude Mythos Preview，纳入Project Glasswing受限访问计划，向安全社区提供了业界一直想要的工具：一款能以前所未有的规模自主发现和利用漏洞的模型。内部测试中，Mythos Preview将漏洞转化为可工作的漏洞利用代码，成功率达181/200次。而该公司前代旗舰Claude Opus 4.6在数百次尝试中仅成功2次。新模型已在所有主流操作系统和浏览器中发现数千个高危漏洞。在一个记录在案的案例中，它将四个漏洞链接成一个浏览器漏洞利用，成功逃逸渲染器和操作系统沙箱——这一成就若由人类专家团队完成，需要数周时间。

然而，这一能力不会向付费企业开放。

Anthropic反而组建了一个由45家合作伙伴组成的联盟，其中包括苹果、谷歌和主要基础设施提供商。他们将获得Glasswing访问权限，主动强化自身系统。其他所有人只能等待。这是一个根本性的战略选择：Anthropic押注基于能力考量的分阶段部署将成为行业标准，即使这意味着将安全公司、渗透测试企业和想要立刻使用该工具的企业客户拒之门外。

限制的理由很简单。如果Mythos Preview的能力代表了一个真正的能力门槛——AI辅助漏洞利用开发变得轻而易举——那么在毫无准备的情况下广泛发布可能加速现实世界的攻击。Anthropic红队记录了逃逸操作系统沙箱、通过微妙竞态条件和KASLR绕过实现根权限的漏洞利用。不加区分地发布这种能力，用该公司的话说，就是"不安全部署"。

但反驳同样尖锐。开发者和安全社区的批评者指出，恶意行为者不会面临这样的限制。国家支持的黑客和犯罪集团不会签署合作伙伴协议或等待行业准备。通过将访问权限制在精心挑选的联盟内，Anthropic可能只是在安全责任的伪装下打造竞争护城河——而实际的威胁态势无论如何都会向前推进。

Glasswing模式也引发了"安全研究访问"是否能转化为真正生态系统保护的疑问。合作伙伴将使用Mythos Preview发现并修补自身漏洞，但这将第三方软件、遗留系统和小机构留在联盟覆盖范围之外。世界共享的网络攻击面积极其庞大；45家合作伙伴——无论多大——无法全面覆盖。

Anthropic真正在测试的是，行业是否会接受受限部署作为前沿模型的新常态。如果Glasswing成功，就确立了先例：触发强制访问限制、协调披露和分阶段推出的能力门槛。如果失败——因为企业转向不那么谨慎的竞争对手，或者恶意行为者无论如何利用相同漏洞——安全优先的定位就成了负担。

目前，门依然紧闭。问题在于企业愿意在门外等多久。