开源综合自 1 个来源

腾讯开源Agent记忆方案令牌消耗骤降61%

要点

参考来源 (1)

AI Agent大规模部署的成本问题，终于有了开源解法。

腾讯本周正式开源了旗下Agent记忆技术方案。根据量子位等科技媒体报道，该技术最高可将AI Agent的令牌消耗降低61%，同时将任务成功率提升51%。这两个数字对于正在评估Agent部署成本的团队而言，意味着盈亏平衡点的根本性改变。

核心技术逻辑指向一个行业痛点：上下文窗口耗尽。随着Agent运行时间拉长，对话历史、工具调用记录、中间推理过程不断累积。大多数系统的处理方式是将全部上下文完整传递给底层大模型，导致推理成本随会话长度线性增长，性能也在上下文超过阈值后急剧下降。

腾讯的方案采用分层记忆压缩机制。系统将信息划分为工作记忆、情景记忆和语义记忆三个层级，只保留与当前任务最相关的内容。这一设计避免了暴力上下文累积的效率损耗，让Agent在保持任务连贯性的同时，大幅减少每次推理所需的令牌数量。

对于成本敏感的部署场景，这个优化的价值直接体现在账本上。以月均消耗2000美元API成本的部署规模为例，61%的令牌削减对应约1220美元的月度节省。规模放大到企业级部署，这笔差额足以支撑额外的Agent实例或重新分配到模型能力升级。

腾讯选择了完全开源的发布模式，代码已开放访问。这意味着开发团队可以直接审查压缩算法的实现细节，在自有工作流中验证效果，而无需承担任何许可费用。对于成本高度敏感的Agent开发者而言，这大幅降低了采用门槛。

任务成功率同步提升51%这一数据值得关注。压缩记忆的同时提升任务完成度，说明层级化记忆管理不仅优化了成本结构，还改善了模型收到的输入质量——当冗余信息被过滤，底层大模型的推理效率随之提升。

腾讯的开源动作延续了头部AI实验室的一贯策略：在模型层展开竞争，将关键基础设施免费开放以锁定开发者生态。该方案的推广速度将取决于社区验证的效率，以及与主流Agent框架的集成进度。