
Google周三(3/12)发布了Gemma 3,意谓着Google于去年2月首度发表的Gemma轻量模型家族已来到第三代,Gemma 3提供了1B、4B、12B及27B参数等4种版本,可于单一的GPU或TPU上执行,除了将脉络窗口长度从Gemma 2的8k Token,扩大至32k(1B)与128k之外,亦已支援超过140种语言,且除了1B之外的模型皆开始支援多模态,能够理解图像加上文字的输入,但目前仅支援文字输出。
Google替Gemma社群成立了Gemmaverse,以让Gemma开发者交流彼此的创意,在Gemma问世的13个月以来,相关模型已有超过1亿次的下载,开发者在Gemmaverse上分享了超过6万个Gemma变种模型。
Google说明,Gemma 3採用与Gemma 2模型相同的研究与技术而打造,该系列着眼于可直接在手机、笔记型电脑及工作站等装置上快速执行,协助开发者在人们需要的任何地方建置AI应用程序,开发者可根据硬件及性能需求,选择最适合的模型规格。
最新的Gemma 3可替35种语言提供开箱即用的支援,也能支援逾140种语言的预训练;除了1B之外的Gemma 3版本皆支援可同时输入文字、图像及短影音,并输出文字;有了128k Token的脉络长度,将允许应用程序处理及理解大量资讯;新版亦支援函数呼叫与结构化输出,以协助自动化任务执行与打造代理体验;Gemma 3导入了官方的量化版本,减少模型尺寸与运算要求,并维持高精度。
另一方面,Gemma 3在 Chatbot Arena 排行榜上的初步人类偏好评估中,超越了Llama-405B、DeepSeek-V3与o3-mini,这是个由人类盲测各种大型语言模型的流畅、準确或是可用性的即时排行榜,Gemma 3 27B目前排在第十名,胜过Llama-405B、DeepSeek-V3或o3-mini,而且即使DeepSeek R1在评测分数中微幅胜过了Gemma 3 27B,但DeepSeek R1使用了32个Nvidia H100的GPU,Gemma 3 27B却只用了一个GPU。
同一天Google也发表了基于Gemma 3的ShieldGemma 2,这是个4B影像安全检查器,可用来过滤危险内容、色情与暴力。
开发人员可透过Google AI Studio、Kaggle或Hugging Face下载Gemma 3系列的开源模型。