Google释出1B/4B/12B/27B的 Gemma 3，开始支援多模态

图片来源:

Google

Google周三（3/12）发布了Gemma 3，意谓着Google于去年2月首度发表的Gemma轻量模型家族已来到第三代，Gemma 3提供了1B、4B、12B及27B参数等4种版本，可于单一的GPU或TPU上执行，除了将脉络窗口长度从Gemma 2的8k Token，扩大至32k（1B）与128k之外，亦已支援超过140种语言，且除了1B之外的模型皆开始支援多模态，能够理解图像加上文字的输入，但目前仅支援文字输出。

Google替Gemma社群成立了Gemmaverse，以让Gemma开发者交流彼此的创意，在Gemma问世的13个月以来，相关模型已有超过1亿次的下载，开发者在Gemmaverse上分享了超过6万个Gemma变种模型。

Google说明，Gemma 3採用与Gemma 2模型相同的研究与技术而打造，该系列着眼于可直接在手机、笔记型电脑及工作站等装置上快速执行，协助开发者在人们需要的任何地方建置AI应用程序，开发者可根据硬件及性能需求，选择最适合的模型规格。

最新的Gemma 3可替35种语言提供开箱即用的支援，也能支援逾140种语言的预训练；除了1B之外的Gemma 3版本皆支援可同时输入文字、图像及短影音，并输出文字；有了128k Token的脉络长度，将允许应用程序处理及理解大量资讯；新版亦支援函数呼叫与结构化输出，以协助自动化任务执行与打造代理体验；Gemma 3导入了官方的量化版本，减少模型尺寸与运算要求，并维持高精度。

另一方面，Gemma 3在 Chatbot Arena 排行榜上的初步人类偏好评估中，超越了Llama-405B、DeepSeek-V3与o3-mini，这是个由人类盲测各种大型语言模型的流畅、準确或是可用性的即时排行榜，Gemma 3 27B目前排在第十名，胜过Llama-405B、DeepSeek-V3或o3-mini，而且即使DeepSeek R1在评测分数中微幅胜过了Gemma 3 27B，但DeepSeek R1使用了32个Nvidia H100的GPU，Gemma 3 27B却只用了一个GPU。

同一天Google也发表了基于Gemma 3的ShieldGemma 2，这是个4B影像安全检查器，可用来过滤危险内容、色情与暴力。

开发人员可透过Google AI Studio、Kaggle或Hugging Face下载Gemma 3系列的开源模型。

CB科技站

Google释出1B/4B/12B/27B的 Gemma 3，开始支援多模态

与本文相关的文章