主打行动装置本地AI运算，Google释出Gemma 3n轻量模型

Google推出Gemma 3n预览版，进一步推进语言模型在行动装置本地端的应用。Gemma 3n为一套主打轻量与高效能的开放模型，专为手机、平板与笔记型电脑等装置设计。与Gemma 3 4B模型于行动装置端相比，Gemma 3n回应速度约快1.5倍，同时提升理解品质，展现本地人工智慧运算的即时性与实用价值。

Gemma 3n的主要特色在于全新架构，并与高通、联发科、三星系统LSI等多家行动晶片厂商合作。Google团队根据现代行动处理器的特性进行架构最佳化，使模型可在2GB至3GB记忆体空间下运作。

Gemma 3n公开版本提供5B及8B两种参数规格，并透过PLE（Per-Layer Embeddings）等技术，降低记忆体需求并提升运算效率，官方也以E4B、E2B说明有效记忆体占用，让开发者可在一般硬件条件下，在主流行动装置或笔电部署具多模态潜力的生成式人工智慧。

Gemma 3n在Chatbot Arena Elo评分达1283分，仅略低于专有模型Claude 3.7 Sonnet，并超越多数同级与开放模型。在多任务语言理解基準MMLU测试中，Gemma 3n支援mix’n’match动态组态，开发者可根据装置与应用需求，灵活切换2B、4B等多种子模型组合，在记忆体与效能间取得平衡。

Gemma 3n也强调多模态处理潜力，目前预览版已支援文字与图像功能，官方后续将释出音讯理解、语音辨识与语音翻译等功能。之后开发者便可利用该模型在装置端，开发即时语音助理、影音互动应用及隐私敏感场景的人工智慧服务，减少对云端依赖，实现即时且个人化的人工智慧功能。

Google指出，Gemma 3n採用与Gemini Nano相同的次世代基础架构，将带动人工智慧功能进一步普及至Android、Chrome等终端应用，并陆续释出更多模组与功能。官方目前提供Google AI Studio文字互动测试，以及Google AI Edge套件本地开发两种体验Gemma 3n的管道。

CB科技站

主打行动装置本地AI运算，Google释出Gemma 3n轻量模型

与本文相关的文章