当全球芯片巨头还在争论下一代训练芯片的架构时,中国一家初创公司已悄然成为独角兽——而它的赌注押在了推理侧。曦望科技近日获得超过百亿人民币估值,跃升为国内首家专注推理GPU的独角兽企业,折射出AI基础设施赛道的价值迁移正在加速。
这笔融资背后是清晰的投资逻辑:训练芯片决定模型能力上限,但推理芯片决定商业化下限。每一次大模型推理调用都在消耗算力,当日均调用量达到数十亿次时,推理成本直接决定了商业模式能否成立。曦望科技联合CEO王湛在接受采访时明确表示,谁能把推理成本做到更低,谁就能赢得市场。
曦望科技将目标锁定在0.01元/百万Token的成本区间。如果这一目标实现,AI交互的经济模型将发生根本性改变——当单次调用成本足够低时,几乎所有数字化场景都能嵌入AI能力。这不仅意味着应用层的爆发,更意味着推理侧基础设施将成为价值捕获的核心节点。
国内大模型正加速规模化部署,推理算力需求激增。传统GPU供应链持续承压,为曦望这类专注推理芯片的企业创造了窗口期。但竞争格局正在快速变化——英伟达、AMD等国际巨头不会轻易放弃推理市场,华为等国内大厂也在全栈布局。曦望能否在规模化落地中持续保持成本优势,将是真正的考验。
百亿估值反映的不仅是市场对推理芯片赛道的看好,更是对长期价值的提前定价。王湛的判断能否兑现,取决于曦望能否在商业化阶段证明自己。推理芯片战争,才刚刚开始。