AI推理领域长达八年的绝对统治正在迎来首个真正的挑战者。
Gimlet Labs于本周一完成8000万美元的A轮融资——如果不了解这家公司的核心技术,这个数字在当今AI融资市场中几乎不会引起关注。这家旧金山初创公司开发了一套中间件技术,能够让大型语言模型同时在英伟达、AMD、英特尔、ARM、Cerebras和d-Matrix芯片上运行推理任务,以单一供应商解决方案无法实现的方式分配计算负载。
这轮融资传递的信号比又一笔AI基础设施投资更为深远。投资者正在押注一个时代的终结——即GPU单一文化时代,英伟达的Hopper和Blackwell架构在模型部署领域近乎完全控制市场的局面正面临结构性脆弱。知情人士透露,推理市场正以超出预期的速度走向商品化,没有哪家芯片供应商能够满足未来三年需求曲线。
Gimlet的技术直击一个真实瓶颈。随着企业将更大规模的模型投入生产应用,推理计算的成本和可用性已成为刚性约束。英伟达的H100和B200 GPU仍然稀缺、昂贵,且大量配额已分配给云端大厂。中小型玩家和企业买家面临漫长的交付周期和不利的定价。Gimlet将自己定位为异构硬件的连接层——让客户能够在不重构模型基础设施的情况下混用AMD的MI300X、英特尔的高迪加速器,或Cerebras的专用推理芯片。
从行业基准来看,这笔融资规模也印证了投资者的坚定信念。根据PitchBook数据,2025年AI基础设施初创公司的A轮融资中位数为2800万美元。Gimlet的8000万美元接近这一中位数的三倍——这一溢价反映了技术雄心和后英伟达推理基础设施的战略赌注。
公司计划将这笔资金用于扩大工程团队规模,并扩展其编译器技术。该技术能够将模型架构转换为跨不同芯片的优化执行路径。当前版本支持六种不同芯片生态,且无需开发者修改模型代码。这正是关键差异所在:抽象化而不牺牲性能。
Gimlet最终会成为异构AI未来的连接层,还是仅仅是芯片厂商建立自己的互操作标准之前的过渡层,目前仍是未知数。英伟达的CUDA生态系统仍然根深蒂固,且该公司自身的推理优化工具仍在持续改进。但8000万美元表明,市场相信替代方案有着真实的成功机会——支撑英伟达推理估值溢价的假设可能不会永远成立。