产品综合自 1 个来源

Anthropic推出Claude Cowork正面对标OpenClaw

要点

• Anthropic发布Claude Cowork采用沙箱执行
• SimonW、Mollick对比Claude Cowork优于OpenClaw
• GPT-5.4 mini速度提升2倍
• GPT-5.4 mini定价每百万token 0.75美元输入
• API提供40万上下文窗口
• Mini仅消耗GPT-5.4 Codex配额的30%

参考来源 (1)

[1] Anthropic推出Claude Cowork对抗OpenClaw — Latent Space ↗

Anthropic正式发布Claude Cowork，这款桌面端编程智能体被定位为OpenAI OpenClaw的强力竞争对手。此举标志着Anthropic在快速演进的AI编程助手市场中的一次重要战略布局。行业观察者SimonW及知名AI研究员Ethan Mollick等多位人士已对两款产品进行对比，普遍认为Anthropic的新产品在关键领域具备竞争力。

核心技术：沙箱隔离与Electron架构

Claude Cowork的核心差异化体现在两大架构选择：沙箱执行机制与Electron框架设计。沙箱执行通过将代码执行与主机系统隔离，提供企业级部署所需的安全保障。Electron框架则确保跨平台桌面功能，与现代开发工具的主流构建方式保持一致。早期用户对这两项技术决策给予认可，不过远程控制功能目前仍处于"即将推出"阶段。

Claude Cowork发布的时机颇具深意。业界人士指出，Anthropic此前在Clawdbot合作中"错失良机"，此次发布是公司证明自己在自主编程智能体领域实力的关键机会。正如行业评论所援引Jensen Huang的观点："每家公司都需要一个OpenClaw战略"——而Anthropic如今已交出自己的答卷。

OpenAI同步出击：GPT-5.4 Mini与Nano

同一周内，OpenAI发布了GPT-5.4 mini与GPT-5.4 nano，被誉为公司迄今为止最具能力的编程小模型。两款发布展示了OpenAI在智能体任务和小体量智能体架构优化方面的持续投入。

GPT-5.4 mini相比GPT-5 mini实现超过2倍速度提升，API版本提供40万上下文窗口。OpenAI声称该小模型在SWE-Bench Pro、OSWorld-Verified等基准测试中接近更大体量GPT-5.4的表现，同时仅消耗GPT-5.4 Codex配额的30%。这一效率优势使其特别适合后台编程工作流和多智能体分发场景。

定价与性能权衡

然而此次发布也引发争议。开发者迅速注意到OpenAI定价的老问题：GPT-5.4 mini输入价格为每百万token 0.75美元，输出价格为每百万token 4.5美元，nano层级定价也高于前代产品。第三方评估结果呈现分歧——Mercor APEP-Agents基准测试显示，xhigh推理模式下mini达到24.5%的Pass@1得分，而BullshitBench则显示小模型在虚假前提陷阱的抵抗能力排名较低。

OpenAI同时低调处理了行为调优问题，通过5.3版本即时更新改善了用户反馈的"烦人的标题党式"输出风格。

智能体基础设施生态成熟

两款发布共同勾勒出一个更宏大的行业趋势：代码执行智能体正成为核心产品架构。随着Claude Cowork入局、OpenAI扩展小模型阵容，开发者在AI辅助编程领域面临愈发丰富但也更加复杂的选择。