Gemma4 正式发布:谷歌的开源翻身仗
4月3日凌晨,Google DeepMind 悄然上线了新一代开源模型 Gemma4。没有盛大的发布会,没有明星代言,但这次更新却让全球开发者集体“抬头”——不是因为参数有多夸张,而是因为谷歌终于把许可证从自家的“限制性协议”换成了 Apache 2.0。
这意味着什么?你可以拿它做商业产品,可以改代码、卖服务、集成进APP,甚至不用通知谷歌。没有法律风险,没有隐藏条款。这在大厂开源圈里,几乎是“破天荒”的举动。

四款模型,覆盖从手机到服务器
Gemma4 没有搞“一个模型打天下”的套路,而是直接推出了四款不同尺寸的版本,真正做到了“你想怎么用,就怎么选”:
- 31B Dense:310亿参数,全激活,适合做研究或部署在H100这类高端卡上。在开源模型排行榜上,它排到了第三,接近Llama 3 70B的水平,但只需要一张消费级显卡就能跑起来。
- 26B A4B MoE:总参数252亿,但每次推理只激活38亿。速度比4B模型还快,效果却接近30B级别。适合中小企业做客服机器人、内容审核,成本低、效率高,是目前最务实的选择。
- E4B 和 E2B:专为手机、平板、嵌入式设备设计。E2B 在部分安卓手机上内存占用不到1.5GB,能本地运行,不依赖云端。你甚至可以在旧款iPhone或千元机上跑一个能写代码、答数学题的AI助手。

数学和代码能力,直接拉满
别再问“开源模型能不能写代码”了。Gemma4 的编程能力,已经让很多开发者开始重新考虑工具链。
- 在 Codeforces 编程竞赛评分系统中,它的ELO分从110飙到2150——这个分数,已经超过了90%的业余程序员,接近职业选手水平。
- 在 LiveCodeBench 的真实编程任务测试中,正确率从不到30%跳到80%,能处理复杂函数、调试错误、写单元测试。
- 数学题方面,AIME(美国数学邀请赛)2026真题,它答对了89.2%。去年的Gemma3只有20%。
- 科学问答(GPQA Diamond)得分84.3%,意味着它能看懂研究生级别的物理、生物论文摘要,给出合理推论。
这些不是“模拟题”成绩,是实打实的公开测试。你甚至可以拿它去帮学生做作业——当然,别指望它替你考试。

能“思考”,能“干活”,还能听声音
Gemma4 不只是“更聪明”,它变得更像一个能自己动起来的工具。
- 思考模式:打开后,模型不会直接给你答案,而是先“想一想”——像人一样分步骤推理。比如问“怎么修漏水的水龙头?”,它会列出工具清单、步骤顺序、注意事项,而不是只说“换垫圈”。
- 原生支持函数调用:你可以让它调用API、查天气、发邮件、操作数据库,输出结构化JSON。谷歌同步推出了开源工具包 ADK,开发者能快速把它变成一个能自动执行任务的“智能体”。
- 多模态全支持:所有版本都能看图、看视频。E4B 和 E2B 还额外内置了音频编码器,能直接听语音、转文字、翻译外语。你不用再额外接Whisper,手机上就能实现语音交互。
这意味着,你可以在一个离线的安卓APP里,塞进一个能看懂截图、听懂你说的话、还能帮你写代码的AI助手——而不用连网。
为什么这次不一样?
过去一年,国内模型如 DeepSeek、Qwen、GLM 快速迭代,开源社区一度被“中国力量”主导。谷歌的Gemma3被很多人认为“不够用”“太保守”。
但这次,谷歌没跟风堆参数,而是做了三件事:
- 把协议换成 Apache 2.0——法律上彻底放开;
- 把模型压缩到手机能跑——工程上真正落地;
- 把能力拉到接近闭源模型——性能上不再妥协。
这不是“技术秀”,这是“重新定义开源”。
你不再需要“等大厂开放”——现在,你可以直接拿 Gemma4 做自己的产品。一个创业团队,用 E2B + ADK,就能做出一个离线的智能客服APP;一个教育机构,能把它嵌入平板,给乡村学生做数学辅导;一个硬件厂商,能把它装进智能手表,让它听懂你的指令。
结语:开源,终于有人认真做了
过去几年,太多“开源”只是发个模型权重,附带一堆法律限制、商业禁令、禁止商用的条款。开发者用着提心吊胆,怕哪天被起诉。
Gemma4 的出现,像是一记清醒的耳光:真正的开源,不是发个模型就完事,而是让普通人能用、敢用、放心用。
现在,你不需要顶级算力,不需要云服务,甚至不需要联网——一块普通手机芯片,就能跑出接近GPT-4的推理能力。
这,才是技术该有的样子。