
Google推出Gemma 3n预览版,进一步推进语言模型在行动装置本地端的应用。Gemma 3n为一套主打轻量与高效能的开放模型,专为手机、平板与笔记型电脑等装置设计。与Gemma 3 4B模型于行动装置端相比,Gemma 3n回应速度约快1.5倍,同时提升理解品质,展现本地人工智慧运算的即时性与实用价值。
Gemma 3n的主要特色在于全新架构,并与高通、联发科、三星系统LSI等多家行动晶片厂商合作。Google团队根据现代行动处理器的特性进行架构最佳化,使模型可在2GB至3GB记忆体空间下运作。
Gemma 3n公开版本提供5B及8B两种参数规格,并透过PLE(Per-Layer Embeddings)等技术,降低记忆体需求并提升运算效率,官方也以E4B、E2B说明有效记忆体占用,让开发者可在一般硬件条件下,在主流行动装置或笔电部署具多模态潜力的生成式人工智慧。
Gemma 3n在Chatbot Arena Elo评分达1283分,仅略低于专有模型Claude 3.7 Sonnet,并超越多数同级与开放模型。在多任务语言理解基準MMLU测试中,Gemma 3n支援mix’n’match动态组态,开发者可根据装置与应用需求,灵活切换2B、4B等多种子模型组合,在记忆体与效能间取得平衡。
Gemma 3n也强调多模态处理潜力,目前预览版已支援文字与图像功能,官方后续将释出音讯理解、语音辨识与语音翻译等功能。之后开发者便可利用该模型在装置端,开发即时语音助理、影音互动应用及隐私敏感场景的人工智慧服务,减少对云端依赖,实现即时且个人化的人工智慧功能。
Google指出,Gemma 3n採用与Gemini Nano相同的次世代基础架构,将带动人工智慧功能进一步普及至Android、Chrome等终端应用,并陆续释出更多模组与功能。官方目前提供Google AI Studio文字互动测试,以及Google AI Edge套件本地开发两种体验Gemma 3n的管道。