Mistral AI 发布企业级 AI 模型构建系统 Forge,聚焦于企业利用自有数据训练定制化模型的需求。官方表示,Forge 可让企业以内部文档、代码库、结构化数据和运营记录作为训练材料,使模型学习组织内部使用的术语、作业流程、推理模式与限制条件,适用于企业代理、决策支持与工具操作等场景。
Mistral AI 发布的 Forge 支持模型生命周期的多个阶段,包括预训练、后训练与强化学习。企业可通过该系统构建具备特定领域知识的模型,并根据任务需求调整模型行为,再通过强化学习使模型与代理更贴合内部政策、评估标准与运营目标。Mistral AI 还将此类定制化模型能力延伸至智能代理,使模型不仅能生成响应,还能在企业环境中执行多步骤流程与工具操作。
现有通用模型大多基于公开数据构建,虽能处理广泛任务,但企业实际运营依赖的是内部工程规范、合规政策、历史决策与专有知识。Forge 的设计方向是将这些企业内部上下文直接融入模型训练,而非仅依赖公开数据构建通用能力。
Forge 支持稠密架构与混合专家架构(MoE),企业可根据性能、延迟与算力成本需求灵活选择,同时支持多模态数据训练。Mistral AI 还强调,Forge 采用代理优先设计,类似 Mistral Vibe 的自主代理可通过自然语言执行模型微调、超参数搜索、任务调度与合成数据生成,系统将持续监控评估指标,防止模型在既有基准上退化。
在模型、数据与治理机制的控制权方面,Mistral AI 表示,企业可在自有基础设施中训练与部署模型,并依据内部政策、合规要求与治理框架管理模型行为,以满足受监管行业与大型组织对数据控制、知识资产与自主性的需求。
Forge 的应用场景涵盖政府机构、金融机构、软件团队、制造业与大型企业。组织可利用政策文件、风险管控流程、专有代码库、工程规格与维护记录等内部数据训练模型,并用于政策分析、合规作业、编程开发支持、设备诊断与运营决策等工作。Mistral AI 已与 ASML、新加坡 DSO 国家实验室、爱立信与欧洲航天局等机构合作,利用 Forge 基于专有数据训练模型。