开发工具综合自 3 个来源

AWS发布Nova Forge SDK简化模型定制流程

要点

参考来源 (3)

2026年3月18日，AWS正式发布Nova Forge SDK，这是一款统一开发工具包，旨在让企业团队更便捷地自定义Amazon Nova模型。该SDK直击大型语言模型落地的核心痛点：将通用AI系统定制化以满足特定业务需求，而无需深厚的技术积累。

传统LLM定制流程复杂繁琐，团队需要处理依赖管理、选择训练镜像、配置配方、搭建基础设施，每一步都要求专业知识和大量时间投入。Nova Forge SDK通过提供简洁友好的开发接口，全面化解这些障碍。

模型微调过程中普遍存在灾难性遗忘现象——随着专业数据集训练加深，模型会逐渐丧失指令遵循、推理能力、广泛知识等核心能力。Nova Forge通过多种定制方法应对这一挑战：监督微调（SFT）、直接偏好优化（DPO）和强化微调（RFT）。

SDK支持从Amazon Bedrock适配到Amazon SageMaker AI深度定制的完整定制选项链。客户可从早期模型检查点开始开发，将自有数据集与Amazon精选数据混合使用，在保持模型质量的同时获得更大灵活性。

AWS以Stack Overflow问答质量分类为案例展示Nova Forge实力。团队使用2016至2020年间6万条问答数据集，将其分为三类：高质量问题（HQ，无需编辑）、需编辑的低质量问题（LQ_EDIT）、应关闭的低质量问题（LQ_CLOSE）。

完整工作流包括：评估基线模型表现、应用监督微调提升准确率、部署强化微调进一步优化响应质量。每个定制阶段后进行效果评估，最终将模型部署至Amazon SageMaker AI推理端点。

与Nova Forge配套，AWS还推出了Strands Evals框架，专为生产环境中的AI Agent评估而设计。传统软件测试依赖确定性输出，但AI Agent即使面对相同输入也会产生多样响应，导致系统化评估极为困难。

Strands Evals提供内置评估器、多轮对话模拟能力和报告工具，评估帮助性、连贯性、事实一致性等难以机械检验的质量维度。框架关注Agent是否采取适当步骤达成结论，而非仅检查最终输出是否看起来正确。

两款工具的发布表明AWS正构建完整的企业AI开发生态，从模型定制到生产评估全覆盖。通过降低技术门槛、提供系统化工具，AWS押注AI应用的下一波增长将来自各行业基于基础模型定制开发，而非从零构建。

SDK已在GitHub开源（aws/nova-customization-sdk），配套文档涵盖前置要求、安装配置及Amazon SageMaker AI训练任务集成指南。