谷歌下一代AI模型Gemini 3.5疑似泄露,单次生成3000行代码引发开发者震动
近日,社交平台X上一名知名技术博主Pankaj Kumar发布了一系列内部测试截图与代码片段,直指谷歌正在秘密开发的下一代AI模型——Gemini 3.5。尽管谷歌尚未官方确认,但泄露内容中出现的“gemini-for-google-3.5”变量名、API调用结构和工程级输出,让不少开发者相信:这并非虚构,而是真实存在的内部版本。
最令人震惊的是,一个代号为“Snow Bunny”的测试模型,竟能在一次提示(Prompt)下,完整生成一个具备前后端交互、数据库连接和用户界面的可运行应用。截图显示,它输出的代码结构清晰,注释完整,甚至包含了单元测试和依赖配置文件——这在过去几乎需要一个小型团队数天才能完成的工作,如今AI只需几分钟。

不只是写代码:它能“想清楚”再回答
不同于当前主流AI模型“秒答式”输出,Gemini 3.5引入了一种被称为“系统2思维”的新机制。简单说,它不再急于给出答案,而是会在后台进行多轮自我验证、逻辑推演和错误回溯——就像人类工程师在动笔前先画流程图、想边界条件。
在一段泄露的测试日志中,当被问及“如何用Python实现一个带缓存的并发爬虫,避免被反爬机制封禁”时,模型没有直接扔出一段代码,而是先列出5种可能的反爬策略,评估每种的可行性,再选择最优方案并输出完整实现。这种“慢思考”模式,被内部称为“Deep Think”,在逻辑推理测试中的准确率高达80%,远超当前GPT-4o(约58%)和Claude 3.5 Opus(约61%)。
不止一个模型:谷歌正在打造“AI工具箱”
根据泄露的内部文档,谷歌并非只在打磨一个通用模型,而是构建了一套分工明确的AI家族:
- Fierce Falcon:专攻高性能计算与复杂算法推理,响应速度极快,适合金融建模、科学计算等对延迟敏感的场景。
- Ghost Falcon:专注多模态创作,能根据文字描述生成高保真UI设计稿、动态交互原型,甚至能合成符合品牌调性的背景音乐与音效。
- Snow Bunny:全能型应用构建者,目标是让非专业开发者也能“一句话”做出可用的产品原型。
这意味着,未来你可能不再需要单独使用Midjourney、Figma、CodeSandbox和Postman——一个Gemini 3.5的多模态协同系统,就能完成从构思到上线的全流程。
跑分数据惊人,但真实体验才是关键
虽然泄露的基准测试显示Gemini 3.5在MMLU、GSM8K等公开测试中大幅领先,但真正的战场不在分数,而在开发者手中的键盘。
有工程师在测试中尝试用Snow Bunny构建一个完整的待办事项App,包含React前端、Node.js后端、SQLite数据库和JWT鉴权。结果不仅代码能跑通,还自动配置了Dockerfile、README文档和GitHub Actions工作流——这已经不是“辅助编码”,而是“替代初级工程师”。
更值得关注的是,有开发者发现,该模型对“非标准需求”的理解能力显著提升。比如,当被要求“做一个让爷爷奶奶也能用的记账App”时,它没有堆砌花哨功能,而是设计了大字体、语音输入、自动分类和微信分享功能——这种对真实用户场景的洞察,远超当前所有竞品。
距离上线还有多远?
目前,谷歌官方尚未回应任何关于Gemini 3.5的消息。但泄露代码中出现的API端点、内部测试密钥和文档注释,都指向一个事实:这个版本早已进入内测阶段,且距离公开只差一步。
有知情人士透露,谷歌计划在2024年Q3的I/O大会上,以“AI原生应用开发平台”为名,低调发布这套新系统。首批开放对象可能是企业开发者和部分合作伙伴,而非普通用户。
对普通用户来说,这或许意味着:未来你不再需要下载十几个App,一个AI助手就能帮你做账、设计海报、写邮件、甚至搭建一个小程序。对开发者而言,这更像是一场无声的革命——你的工作,会不会被“Snow Bunny”悄悄取代?