综合综合自 1 个来源

8000万美元押注GPU多元化时代

要点

• Gimlet Labs完成8000万美元A轮融资，支持六种芯片异构推理
• 中间件可在英伟达、AMD、英特尔、ARM、Cerebras、d-Matrix上同时运行
• 融资规模达2025年AI基础设施A轮中位数2800万美元的近三倍
• 技术定位直指英伟达CUDA在推理工作负载中的主导地位

参考来源 (1)

[1] Gimlet Labs融资8000万美元突破AI推理瓶颈 — TechCrunch AI ↗

AI推理领域长达八年的绝对统治正在迎来首个真正的挑战者。

Gimlet Labs于本周一完成8000万美元的A轮融资——如果不了解这家公司的核心技术，这个数字在当今AI融资市场中几乎不会引起关注。这家旧金山初创公司开发了一套中间件技术，能够让大型语言模型同时在英伟达、AMD、英特尔、ARM、Cerebras和d-Matrix芯片上运行推理任务，以单一供应商解决方案无法实现的方式分配计算负载。

这轮融资传递的信号比又一笔AI基础设施投资更为深远。投资者正在押注一个时代的终结——即GPU单一文化时代，英伟达的Hopper和Blackwell架构在模型部署领域近乎完全控制市场的局面正面临结构性脆弱。知情人士透露，推理市场正以超出预期的速度走向商品化，没有哪家芯片供应商能够满足未来三年需求曲线。

Gimlet的技术直击一个真实瓶颈。随着企业将更大规模的模型投入生产应用，推理计算的成本和可用性已成为刚性约束。英伟达的H100和B200 GPU仍然稀缺、昂贵，且大量配额已分配给云端大厂。中小型玩家和企业买家面临漫长的交付周期和不利的定价。Gimlet将自己定位为异构硬件的连接层——让客户能够在不重构模型基础设施的情况下混用AMD的MI300X、英特尔的高迪加速器，或Cerebras的专用推理芯片。

从行业基准来看，这笔融资规模也印证了投资者的坚定信念。根据PitchBook数据，2025年AI基础设施初创公司的A轮融资中位数为2800万美元。Gimlet的8000万美元接近这一中位数的三倍——这一溢价反映了技术雄心和后英伟达推理基础设施的战略赌注。

公司计划将这笔资金用于扩大工程团队规模，并扩展其编译器技术。该技术能够将模型架构转换为跨不同芯片的优化执行路径。当前版本支持六种不同芯片生态，且无需开发者修改模型代码。这正是关键差异所在：抽象化而不牺牲性能。

Gimlet最终会成为异构AI未来的连接层，还是仅仅是芯片厂商建立自己的互操作标准之前的过渡层，目前仍是未知数。英伟达的CUDA生态系统仍然根深蒂固，且该公司自身的推理优化工具仍在持续改进。但8000万美元表明，市场相信替代方案有着真实的成功机会——支撑英伟达推理估值溢价的假设可能不会永远成立。