最新消息:关注人工智能 AI赋能新媒体运营

谷歌发布Gemma 4-12B开源模型 16GB内存可本地运行

科技资讯 admin 浏览

Google发布开源多模态模型Gemma412B

Google正式推出开源大模型Gemma412B。该模型采用“Unified”无编码器架构,取消了传统多模态链路依赖的外部视觉与音频编码器。文字、图像、音频和视频的原始数据直接输入同一个Transformer主干网络。这一设计去掉了外挂翻译环节,显存占用与处理延迟随之降低,跨模态理解更接近原生逻辑。

Gemma412B模型架构

模型针对消费级硬件做了优化。基准测试显示,其成绩接近Google自家26B参数模型,内存占用不到后者的一半。Gemma412B提供256K Token上下文窗口,支持140多种语言。系统内置强化逐步推理的Thinking模式,并原生提供Function Calling功能。

部署门槛进一步下探。流畅运行最低需要16GB显存或统一内存。经过4-bit量化后,显存需求降至8GB,普通笔记本电脑即可完成本地加载。Google AI Edge Gallery已扩展至桌面端,macOS用户下载安装后即可激活。模型自带沙盒Python环境与Eloquent语音系统,用户能在聊天界面直接执行代码、绘制图表,并支持语音对话。

较高的性能密度与端侧适配特性,推动AI算力向去中心化方向转移。本地运行减少了对云端资源的依赖,同时满足低延迟与隐私保护需求,有望为全模态个人助理应用提供基础方案。