稀宇科技正式开源原生多模态模型 MiniMax M3
稀宇科技 MiniMax 今日宣布开源原生多模态旗舰模型 MiniMax M3。该模型总参数量为 428B,激活参数 23B。与常规做法不同,M3 在底层训练初期直接进行多模态混合训练。此前,官方已提前开放模型权重,并同步发布稀疏注意力机制技术论文。
模型上线两周后,在全球综合智能指数排行榜中取得开源模型第一名。发布初期因访问量激增出现体验延迟,技术团队已将模型输出速度从 30 TPS 优化至 80 TPS,后续还将进一步提速。
在编码与智能体能力测试中,M3 展现出较强的任务处理水平。模型可以自主拆解复杂目标,熟练调用外部工具进行多步推理。官方指出,M3 编写的代码旨在达到直接交付标准,减少开发者后期修改的工作量。