最新消息:关注人工智能 AI赋能新媒体运营

IBM开源Granite 4.0 Nano边缘模型,以10亿参数平衡性能与效率

科技资讯 admin 浏览

IBM发布Granite 4.0 Nano系列模型,主打边缘计算与设备端应用,将参数量压缩至约10亿与3.5亿两个级别,同时保持通用任务的可用性能。新系列延续Granite 4.0的训练方法与数据规模,训练数据量超过15万亿Token,现采用Apache 2.0许可证在Hugging Face开放下载。

官方已与vLLM、llama.cpp、MLX等推理框架合作,提供或正在完善对Granite 4架构的支持,便于快速评估与部署。

本次Nano系列提供两种架构:其一是采用Hybrid-SSM的Granite 4.0 H 1B(10亿)与H 350M(3.5亿),目标是在低参数条件下提升长序列建模与执行效率;其二是对应传统Transformer的版本Granite 4.0 1B与350M,考虑到部分生态对混合架构尚未全面优化,提供更广泛的工具链支持。

治理与合规是Granite 4.0的重要诉求,IBM再次强调,Granite 4.0家族是首批获得ISO/IEC 42001认证的开源模型,所有发布的检查点均提供数字签名,可验证来源与文件完整性。

在评测方面,IBM指出Nano系列在通用知识、数学、编程与安全性等领域表现良好,并将指令遵循与工具调用列为关键能力,进行IFEval与Berkeley Function Calling Leaderboard v3等任务测试。目前市场上已有不少参数约十亿的小型语言模型,包括阿里巴巴、谷歌与LiquidAI等团队持续更新该区间模型。在官方公布的测试组合中,Granite 4.0 Nano的平均成绩领先多数同级别小模型。

根据官方测试,Granite-4.0-1B与Granite-4.0-H-1B在通用知识、数学、编程与安全性等多项评测的平均准确率均达到六成以上,不仅超越Qwen3-0.6B与Gemma-3-1B-IT,也接近参数更高的1.7B级别模型。在指令遵循与工具调用等任务导向测试中,Hybrid-SSM架构优势尤为突出,准确率分别达到78.5%与50.2%。这些结果表明,Granite 4.0 Nano能够在有限参数条件下维持高水平的语义理解与逻辑推理能力,兼顾模型精简与计算效率。