AWS在re:Invent大会上宣布推出新服务Nova Forge,让企业能够在Amazon Nova基础模型家族的预训练阶段就导入自有数据,从早期检查点开始打造专用模型。通过数据混合与强化学习,AWS希望在降低灾难性遗忘的同时,保留通用推理与安全能力,并最终将定制模型以私有模型方式托管在Amazon Bedrock上。
目前企业导入生成式AI的做法多依赖提示工程、RAG,或对现成基础模型进行监督微调与强化学习调优,这些做法虽能快速上线,但都发生在模型完整训练之后,较难将专业术语与内部流程真正融入模型底层理解。
Nova Forge则将定制化提前至更早的训练阶段。AWS提供Nova系列模型在预训练、中期训练与后期训练的多个检查点,企业可在Amazon SageMaker上持续进行预训练,将自有专有数据与AWS整理的Nova训练数据混合输入模型,以减少仅使用企业数据进行持续预训练(Continued Pre-Training,CPT)时常见的灾难性遗忘,维持原有的通用推理与指令遵循能力。
Nova Forge支持使用企业自有环境的奖励函数与多轮交互场景,让模型在更贴近实际业务的模拟环境中学习。AWS表示,该服务可用于长流程任务与智能体场景,将任务成功与失败转化为强化学习信号。
针对合规与治理需求,Nova Forge内置负责任AI工具组,提供安全性与内容审查设置。企业可自定义敏感内容处理规则,在金融、医疗或高度监管行业导入模型时保留可控性,而非完全依赖云服务默认策略。
开发团队可在SageMaker Studio选择承接的检查点与数据集,训练完成后将模型导入Amazon Bedrock,以私有模型形式提供API。Nova Forge目前先在美国东部弗吉尼亚区域提供,AWS未公开详细定价,但外媒CNBC报道称,该服务年订阅费为10万美元,且不包含协助训练模型的专家服务费用。