
Google对旗下线上人工智慧开发平台AI Studio进行多项重大更新,重点包括生成式人工智慧技术的原生整合与多模态生成支援。新版本不仅强化Gemini 2.5 Pro等语言模型的应用範围,也针对程序码、图像、语音等各种形式内容生成流程提供原生工具。
本次Google AI Studio更新,最大特点在于导入内建人工智慧程序码生成能力。开发人员仅需输入简要描述,无论为文字、图片或影片,模型便会在AI Studio中直接产生符合需求的前端或后端程序码。相较以往仅能产生程序码片段,需另行串接外部IDE的情境,此次原生整合大幅简化开发流程。
也就是说,开发者现在可于AI Studio进行程序撰写、预览、调整,并可在建置分页一键部署至Google Cloud Run等云端服务。
在多模态生成方面,Google新增生成媒体页籤,开发人员可于此页面快速存取Imagen、Veo、Lyria RealTime等模型,直接生成图像、音乐、语音内容。语音方面,Gemini 2.5 Flash现于Live API提供原生语音对话预览功能,不仅可产生超过30种语音风格,还具备辨识多位讲者与区分背景对话的能力。
Google此次推出的人工智慧程序码生成与应用部署工具,採用AI Studio平台代理API金钥。当开发人员将应用分享给他人试用时,所有API呼叫都经由平台Proxy,API用量计入受邀者的AI Studio帐户,这项设计可简化测试与分享流程。Google提醒,该功能目前为实验性质,分享前应仔细检查程序码内容,以确保资料安全。
在程序码管理与版本控制方面,Google AI Studio提供文件结构浏览、版本比较和即时回溯等功能,开发者可在人工智慧协助下检视与比对程序码异动,并透过对话式程序码反覆调整功能,快速回到先前的检查点进行修正。
此外,Google本次也强调支援MCP(Model Context Protocol),现于Google Gen AI SDK提供原生支援,开发者可结合Google Maps、Gemini API等多种工具,弹性建构跨应用情境的人工智慧体验。Google还释出实验性URL Context工具,开发人员可指定外部连结,让人工智慧模型即时撷取与参考网页内容,应用于事实查核、摘要比对或资料研究。图片来源/Google