谷歌发布Gemma 4-12B开源模型 16GB内存可本地运行

Google发布开源多模态模型Gemma412B

Google正式推出开源大模型Gemma412B。该模型采用“Unified”无编码器架构，取消了传统多模态链路依赖的外部视觉与音频编码器。文字、图像、音频和视频的原始数据直接输入同一个Transformer主干网络。这一设计去掉了外挂翻译环节，显存占用与处理延迟随之降低，跨模态理解更接近原生逻辑。

模型针对消费级硬件做了优化。基准测试显示，其成绩接近Google自家26B参数模型，内存占用不到后者的一半。Gemma412B提供256K Token上下文窗口，支持140多种语言。系统内置强化逐步推理的Thinking模式，并原生提供Function Calling功能。

部署门槛进一步下探。流畅运行最低需要16GB显存或统一内存。经过4-bit量化后，显存需求降至8GB，普通笔记本电脑即可完成本地加载。Google AI Edge Gallery已扩展至桌面端，macOS用户下载安装后即可激活。模型自带沙盒Python环境与Eloquent语音系统，用户能在聊天界面直接执行代码、绘制图表，并支持语音对话。

较高的性能密度与端侧适配特性，推动AI算力向去中心化方向转移。本地运行减少了对云端资源的依赖，同时满足低延迟与隐私保护需求，有望为全模态个人助理应用提供基础方案。

CB科技站

谷歌发布Gemma 4-12B开源模型 16GB内存可本地运行

Google发布开源多模态模型Gemma412B

与本文相关的文章