Anthropic打造了AI历史上最强大的自主黑客工具——然后决定不卖它。这种安全优先定位与企业需求之间的碰撞,正在成为这家公司下一章的核心矛盾。
周一,Anthropic发布了Claude Mythos Preview,纳入Project Glasswing受限访问计划,向安全社区提供了业界一直想要的工具:一款能以前所未有的规模自主发现和利用漏洞的模型。内部测试中,Mythos Preview将漏洞转化为可工作的漏洞利用代码,成功率达181/200次。而该公司前代旗舰Claude Opus 4.6在数百次尝试中仅成功2次。新模型已在所有主流操作系统和浏览器中发现数千个高危漏洞。在一个记录在案的案例中,它将四个漏洞链接成一个浏览器漏洞利用,成功逃逸渲染器和操作系统沙箱——这一成就若由人类专家团队完成,需要数周时间。
然而,这一能力不会向付费企业开放。
Anthropic反而组建了一个由45家合作伙伴组成的联盟,其中包括苹果、谷歌和主要基础设施提供商。他们将获得Glasswing访问权限,主动强化自身系统。其他所有人只能等待。这是一个根本性的战略选择:Anthropic押注基于能力考量的分阶段部署将成为行业标准,即使这意味着将安全公司、渗透测试企业和想要立刻使用该工具的企业客户拒之门外。
限制的理由很简单。如果Mythos Preview的能力代表了一个真正的能力门槛——AI辅助漏洞利用开发变得轻而易举——那么在毫无准备的情况下广泛发布可能加速现实世界的攻击。Anthropic红队记录了逃逸操作系统沙箱、通过微妙竞态条件和KASLR绕过实现根权限的漏洞利用。不加区分地发布这种能力,用该公司的话说,就是"不安全部署"。
但反驳同样尖锐。开发者和安全社区的批评者指出,恶意行为者不会面临这样的限制。国家支持的黑客和犯罪集团不会签署合作伙伴协议或等待行业准备。通过将访问权限制在精心挑选的联盟内,Anthropic可能只是在安全责任的伪装下打造竞争护城河——而实际的威胁态势无论如何都会向前推进。
Glasswing模式也引发了"安全研究访问"是否能转化为真正生态系统保护的疑问。合作伙伴将使用Mythos Preview发现并修补自身漏洞,但这将第三方软件、遗留系统和小机构留在联盟覆盖范围之外。世界共享的网络攻击面积极其庞大;45家合作伙伴——无论多大——无法全面覆盖。
Anthropic真正在测试的是,行业是否会接受受限部署作为前沿模型的新常态。如果Glasswing成功,就确立了先例:触发强制访问限制、协调披露和分阶段推出的能力门槛。如果失败——因为企业转向不那么谨慎的竞争对手,或者恶意行为者无论如何利用相同漏洞——安全优先的定位就成了负担。
目前,门依然紧闭。问题在于企业愿意在门外等多久。