谷歌开源Gemma 4：31B参数，Apache 2.0许可，性能媲美顶尖大模型

Gemma4 正式发布：谷歌的开源翻身仗

4月3日凌晨，Google DeepMind 悄然上线了新一代开源模型 Gemma4。没有盛大的发布会，没有明星代言，但这次更新却让全球开发者集体“抬头”——不是因为参数有多夸张，而是因为谷歌终于把许可证从自家的“限制性协议”换成了 Apache 2.0。

这意味着什么？你可以拿它做商业产品，可以改代码、卖服务、集成进APP，甚至不用通知谷歌。没有法律风险，没有隐藏条款。这在大厂开源圈里，几乎是“破天荒”的举动。

Gemma4 没有搞“一个模型打天下”的套路，而是直接推出了四款不同尺寸的版本，真正做到了“你想怎么用，就怎么选”：

31B Dense：310亿参数，全激活，适合做研究或部署在H100这类高端卡上。在开源模型排行榜上，它排到了第三，接近Llama 3 70B的水平，但只需要一张消费级显卡就能跑起来。
26B A4B MoE：总参数252亿，但每次推理只激活38亿。速度比4B模型还快，效果却接近30B级别。适合中小企业做客服机器人、内容审核，成本低、效率高，是目前最务实的选择。
E4B 和 E2B：专为手机、平板、嵌入式设备设计。E2B 在部分安卓手机上内存占用不到1.5GB，能本地运行，不依赖云端。你甚至可以在旧款iPhone或千元机上跑一个能写代码、答数学题的AI助手。

别再问“开源模型能不能写代码”了。Gemma4 的编程能力，已经让很多开发者开始重新考虑工具链。

这些不是“模拟题”成绩，是实打实的公开测试。你甚至可以拿它去帮学生做作业——当然，别指望它替你考试。

Gemma4 不只是“更聪明”，它变得更像一个能自己动起来的工具。

思考模式：打开后，模型不会直接给你答案，而是先“想一想”——像人一样分步骤推理。比如问“怎么修漏水的水龙头？”，它会列出工具清单、步骤顺序、注意事项，而不是只说“换垫圈”。
原生支持函数调用：你可以让它调用API、查天气、发邮件、操作数据库，输出结构化JSON。谷歌同步推出了开源工具包 ADK，开发者能快速把它变成一个能自动执行任务的“智能体”。
多模态全支持：所有版本都能看图、看视频。E4B 和 E2B 还额外内置了音频编码器，能直接听语音、转文字、翻译外语。你不用再额外接Whisper，手机上就能实现语音交互。

这意味着，你可以在一个离线的安卓APP里，塞进一个能看懂截图、听懂你说的话、还能帮你写代码的AI助手——而不用连网。

过去一年，国内模型如 DeepSeek、Qwen、GLM 快速迭代，开源社区一度被“中国力量”主导。谷歌的Gemma3被很多人认为“不够用”“太保守”。

但这次，谷歌没跟风堆参数，而是做了三件事：

这不是“技术秀”，这是“重新定义开源”。

你不再需要“等大厂开放”——现在，你可以直接拿 Gemma4 做自己的产品。一个创业团队，用 E2B + ADK，就能做出一个离线的智能客服APP；一个教育机构，能把它嵌入平板，给乡村学生做数学辅导；一个硬件厂商，能把它装进智能手表，让它听懂你的指令。

过去几年，太多“开源”只是发个模型权重，附带一堆法律限制、商业禁令、禁止商用的条款。开发者用着提心吊胆，怕哪天被起诉。

Gemma4 的出现，像是一记清醒的耳光：真正的开源，不是发个模型就完事，而是让普通人能用、敢用、放心用。

现在，你不需要顶级算力，不需要云服务，甚至不需要联网——一块普通手机芯片，就能跑出接近GPT-4的推理能力。

这，才是技术该有的样子。