应用综合自 2 个来源

国产视觉大模型浮出水面：OpenAI翻车催生新机会？

要点

• Simon Willison证实ChatGPT Images 2.0自发生成路牌，无用户提示
• 企业买家无法容忍商业工作流中不可预测的内容注入
• 中国视觉基础模型公司浮出水面，成为GPT-Image-2挑战者
• 不可预测输出为注重可靠性的竞争者创造市场空缺
• 中国AI公司可在输出控制和可预测性上实现差异化

参考来源 (2)

[1] ChatGPT图像生成器自创荒诞标牌 — Simon Willison's Weblog ↗
[2] 国产视觉大模型公司挑战GPT-Image-2 — 量子位 QbitAI ↗

一只鹈鹕骑着自行车——当AI生成这样的图像时，结果可能很有趣。但如果同款模型为企业生成季度报告图表时突然出现一块莫名其妙的路牌，那就不是可爱了——这是合规风险。

这就是企业AI采纳正在迎来的转折点。上周，开发者Simon Willison记录了ChatGPT Images 2.0的一个奇特“幻觉”：在生成一组嵌套动物互相骑行的超现实场景时，模型自发插入了一块写着"WHY ARE YOU LIKE THIS"的路牌。Willison独立验证了这一行为——用户并没有在提示词中要求添加这个标识。

对普通用户来说，这只是有趣的内容漂移。对企业采购负责人来说，这是不可接受的输出方差。企业买家为AI生成工具支付溢价，期望供应商的模型提供确定性行为。一张生成图像中哪怕一个不可预测的元素，都可能让数月的品牌一致性工作归零，触发法务审查，或在受监管行业的内容审核中失败。

一家中国公司正在密切关注这一动态。量子位报道显示，一家此前低调的中国视觉基础模型公司已浮出水面，成为GPT-Image-2的潜在挑战者，被描述为捅破了国产AI生图的“天花板”。时机恰到好处：每一个来自在位厂商的高调失误，都在为承诺更可预测行为的挑战者创造市场空间。

竞争逻辑很直接。中国AI开发者历来追求与西方前沿模型的能力对标，往往价格更低。但企业AI市场可能奖励不同的价值主张：模型可靠性而非基准测试统治力。

考虑买家心理。财富500强公司的营销总监不需要世界上最有创意的图像生成器。他们需要一款能产生一致、品牌安全输出的工具——法务团队不会因此找麻烦。当这位买家看到OpenAI的消费产品在任何随意测试图像中生成随机标识时，他们看到的是一种故障模式——这种模式可能在大规模部署时在他们自己的工作流中显现。

构建视觉基础模型的中国竞争者有机会在输出控制上差异化。这意味着对模型生成内容和方式的更严格约束、更可预测的构图规则、以及防止自发内容注入的更强护栏。公开信息尚不清楚任何特定中国公司是否已在生产系统中实现了这种可靠性层级。

明确的是：“混乱标识”时刻表明前沿AI图像模型仍然隐藏着意外行为。对风险厌恶的企业买家来说，这些行为并非“迷人的混乱”——而是商业责任。市场开放是真实的。等待填补这一空白的中国挑战者可能刚刚找到了切入点。