谷歌Gemini 3.5泄露：代号Snow Bunny，单提示生成3000行代码

谷歌下一代AI模型Gemini 3.5疑似泄露，单次生成3000行代码引发开发者震动

近日，社交平台X上一名知名技术博主Pankaj Kumar发布了一系列内部测试截图与代码片段，直指谷歌正在秘密开发的下一代AI模型——Gemini 3.5。尽管谷歌尚未官方确认，但泄露内容中出现的“gemini-for-google-3.5”变量名、API调用结构和工程级输出，让不少开发者相信：这并非虚构，而是真实存在的内部版本。

最令人震惊的是，一个代号为“Snow Bunny”的测试模型，竟能在一次提示（Prompt）下，完整生成一个具备前后端交互、数据库连接和用户界面的可运行应用。截图显示，它输出的代码结构清晰，注释完整，甚至包含了单元测试和依赖配置文件——这在过去几乎需要一个小型团队数天才能完成的工作，如今AI只需几分钟。

不只是写代码：它能“想清楚”再回答

不同于当前主流AI模型“秒答式”输出，Gemini 3.5引入了一种被称为“系统2思维”的新机制。简单说，它不再急于给出答案，而是会在后台进行多轮自我验证、逻辑推演和错误回溯——就像人类工程师在动笔前先画流程图、想边界条件。

在一段泄露的测试日志中，当被问及“如何用Python实现一个带缓存的并发爬虫，避免被反爬机制封禁”时，模型没有直接扔出一段代码，而是先列出5种可能的反爬策略，评估每种的可行性，再选择最优方案并输出完整实现。这种“慢思考”模式，被内部称为“Deep Think”，在逻辑推理测试中的准确率高达80%，远超当前GPT-4o（约58%）和Claude 3.5 Opus（约61%）。

不止一个模型：谷歌正在打造“AI工具箱”

根据泄露的内部文档，谷歌并非只在打磨一个通用模型，而是构建了一套分工明确的AI家族：

Fierce Falcon：专攻高性能计算与复杂算法推理，响应速度极快，适合金融建模、科学计算等对延迟敏感的场景。
Ghost Falcon：专注多模态创作，能根据文字描述生成高保真UI设计稿、动态交互原型，甚至能合成符合品牌调性的背景音乐与音效。
Snow Bunny：全能型应用构建者，目标是让非专业开发者也能“一句话”做出可用的产品原型。

这意味着，未来你可能不再需要单独使用Midjourney、Figma、CodeSandbox和Postman——一个Gemini 3.5的多模态协同系统，就能完成从构思到上线的全流程。

跑分数据惊人，但真实体验才是关键

虽然泄露的基准测试显示Gemini 3.5在MMLU、GSM8K等公开测试中大幅领先，但真正的战场不在分数，而在开发者手中的键盘。

有工程师在测试中尝试用Snow Bunny构建一个完整的待办事项App，包含React前端、Node.js后端、SQLite数据库和JWT鉴权。结果不仅代码能跑通，还自动配置了Dockerfile、README文档和GitHub Actions工作流——这已经不是“辅助编码”，而是“替代初级工程师”。

更值得关注的是，有开发者发现，该模型对“非标准需求”的理解能力显著提升。比如，当被要求“做一个让爷爷奶奶也能用的记账App”时，它没有堆砌花哨功能，而是设计了大字体、语音输入、自动分类和微信分享功能——这种对真实用户场景的洞察，远超当前所有竞品。

距离上线还有多远？

目前，谷歌官方尚未回应任何关于Gemini 3.5的消息。但泄露代码中出现的API端点、内部测试密钥和文档注释，都指向一个事实：这个版本早已进入内测阶段，且距离公开只差一步。

有知情人士透露，谷歌计划在2024年Q3的I/O大会上，以“AI原生应用开发平台”为名，低调发布这套新系统。首批开放对象可能是企业开发者和部分合作伙伴，而非普通用户。

对普通用户来说，这或许意味着：未来你不再需要下载十几个App，一个AI助手就能帮你做账、设计海报、写邮件、甚至搭建一个小程序。对开发者而言，这更像是一场无声的革命——你的工作，会不会被“Snow Bunny”悄悄取代？

CB科技站