开发工具 综合自 3 个来源

AWS发布Nova Forge SDK简化模型定制流程

要点

  • Nova Forge SDK降低企业LLM定制门槛
  • 支持SFT、DPO、RFT解决灾难性遗忘问题
  • Stack Overflow案例使用6万条问答数据集
  • Strands Evals评估非确定性AI Agent
  • 支持从Bedrock到SageMaker AI的完整定制链路
参考来源 (3)
  1. [1] Nova Forge SDK简化模型微调流程 — AWS Machine Learning Blog
  2. [2] Nova Forge SDK解锁企业级AI定制 — AWS Machine Learning Blog
  3. [3] Strands Evals:AI智能体评估框架 — AWS Machine Learning Blog

AWS推出Nova Forge SDK降低模型定制门槛

2026年3月18日,AWS正式发布Nova Forge SDK,这是一款统一开发工具包,旨在让企业团队更便捷地自定义Amazon Nova模型。该SDK直击大型语言模型落地的核心痛点:将通用AI系统定制化以满足特定业务需求,而无需深厚的技术积累。

传统LLM定制流程复杂繁琐,团队需要处理依赖管理、选择训练镜像、配置配方、搭建基础设施,每一步都要求专业知识和大量时间投入。Nova Forge SDK通过提供简洁友好的开发接口,全面化解这些障碍。

解决灾难性遗忘问题

模型微调过程中普遍存在灾难性遗忘现象——随着专业数据集训练加深,模型会逐渐丧失指令遵循、推理能力、广泛知识等核心能力。Nova Forge通过多种定制方法应对这一挑战:监督微调(SFT)、直接偏好优化(DPO)和强化微调(RFT)。

SDK支持从Amazon Bedrock适配到Amazon SageMaker AI深度定制的完整定制选项链。客户可从早期模型检查点开始开发,将自有数据集与Amazon精选数据混合使用,在保持模型质量的同时获得更大灵活性。

实战案例:Stack Overflow问答分类

AWS以Stack Overflow问答质量分类为案例展示Nova Forge实力。团队使用2016至2020年间6万条问答数据集,将其分为三类:高质量问题(HQ,无需编辑)、需编辑的低质量问题(LQ_EDIT)、应关闭的低质量问题(LQ_CLOSE)。

完整工作流包括:评估基线模型表现、应用监督微调提升准确率、部署强化微调进一步优化响应质量。每个定制阶段后进行效果评估,最终将模型部署至Amazon SageMaker AI推理端点。

Strands Evals:系统化Agent评估框架

与Nova Forge配套,AWS还推出了Strands Evals框架,专为生产环境中的AI Agent评估而设计。传统软件测试依赖确定性输出,但AI Agent即使面对相同输入也会产生多样响应,导致系统化评估极为困难。

Strands Evals提供内置评估器、多轮对话模拟能力和报告工具,评估帮助性、连贯性、事实一致性等难以机械检验的质量维度。框架关注Agent是否采取适当步骤达成结论,而非仅检查最终输出是否看起来正确。

行业影响

两款工具的发布表明AWS正构建完整的企业AI开发生态,从模型定制到生产评估全覆盖。通过降低技术门槛、提供系统化工具,AWS押注AI应用的下一波增长将来自各行业基于基础模型定制开发,而非从零构建。

SDK已在GitHub开源(aws/nova-customization-sdk),配套文档涵盖前置要求、安装配置及Amazon SageMaker AI训练任务集成指南。

0:00