应用综合自 2 个来源

面壁2B模型征服郭德纲贯口，Salesforce日处理百万建议

要点

• 面壁2B模型征服《莽撞人》贯口，获国际开发者认可
• Salesforce月均104万建议，服务13000名销售人员
• 消息队列架构突破300请求/分钟限制，延迟降至600毫秒
• AI文化细腻度与商业规模化部署同步成熟

参考来源 (2)

[1] Salesforce月均生成104万条CRM推荐建议 — Salesforce Engineering ↗
[2] 国产开源语音模型复刻郭德纲贯口 — 量子位 QbitAI ↗

机器一个字一个字地吐出《莽撞人》，中间卡了一下。它自己纠正过来，在短语中间恢复节奏，突然间匹配了郭德纲的标志性腔调——那种拖长某些音节的方式，在传统要求停顿的地方停顿，在喜剧需要加速的地方加速。这是中国创业公司面壁（ModelBest）一款20亿参数模型跨越的那个门槛：复制传统相声中最考验功夫的口技表演，却没有听起来像个拙劣模仿品。

《莽撞人》这段贯口将近四分钟。它要求气息控制、音调精准，以及对北京方言的掌握——这些东西人类表演者需要数年才能磨练。对于AI来说，挑战不是发音——而是传统表演的无形架构：何时停顿，何时加速，如何在满足现代观众的同时传承文化记忆。模型做到了。国际开发者在论坛上用同一个词回应：Amazing。

与此同时，在太平洋彼岸，一个Salesforce系统一个月内处理了104万条销售建议。Agentforce驱动的销售智能体整夜处理数十万个客户机会，为13000名销售人员综合电话记录、邮件线程和会议数据。系统每晚在九小时内完成处理，早上交付建议，并且——关键的是——在人类批准之前不修改任何CRM数据。这不算令人印象深刻。这只是日常工作。

两个生产级部署，零重叠。一个检验AI现在能否复制那种难以量化的文化微妙。另一个证明，在平凡的商业任务中运行的AI已经变得——嗯——稀松平常。两个故事都不是关于能力基准测试。它们共同描绘了AI部署今天的现状。

Salesforce工程团队面临一个具体限制：每分钟300请求的平台限制使得标准API执行变得不可能。他们的解决方案是架构性的，而非算法性的。一个消息队列驱动的系统将编排与执行分离，处理高并发而不触发速率限制。他们将数据检索范围缩小到最近的邮件线程，为视频转录实现了快速失败机制，直接回退到语音转录，并将每次请求延迟从1.35秒削减到约600毫秒。对于每个机会27,000个输入词元、数十万条记录，这些优化意味着早上六点前完成与错过早间截止日期之间的差别。

真正的创新不是AI本身——而是确保建议在系统触碰任何CRM数据之前保持可信、可解释和安全的框架。企业采用不取决于AI能做什么，而取决于人类是否信任AI的建议。

这是两个部署共享的潜台词，尽管都没有明说。郭德纲模型成功不是因为它通过了某个技术基准，而是因为听众——熟悉原版的中国人——觉得它捕捉到了某种真实。Salesforce系统成功是因为销售人员打开建议、审核它们、决定是否采取行动。两者都证明，在规模下运行的AI必须从人类判断中赢得合法性，而不是取代它。

当一个20亿参数模型能够复制文化记忆，一个百万建议系统平稳运行而不出问题，会发生什么？天花板升高了。曾经看起来对自动化太微妙的应用——表演艺术、复杂销售判断、任何需要情境品味的东西——现在面临认真的技术探讨。同时，地板也在巩固。能够可靠规模化运行的企业AI部署成为基础设施，而非实验。问题从"AI能做到吗？"变成"AI应该这样做吗？"——而这个问题属于人类，不属于模型。