Google Gemini进驻分布式云端服务GDC,扩展本地AI部署
Google宣布Gemini现已可在其分布式云端服务(Google Distributed Cloud,GDC)本地端运行。此次更新涵盖两种模式:其一是正式推出的GDC离线隔离模式(Air-gapped),提供与公共互联网隔离、无对外连接的部署选项;其二是预览阶段的GDC联网模式(Connected),支持联网场景。
Gemini在GDC上并非单纯上架模型,而是以完整人工智能平台形式提供。Google在客户或其合作伙伴机房内提供托管Gemini端点,采用零接触更新机制,并通过第7层负载均衡及自动扩展技术,确保运算性能与服务可用性。硬件方面,GDC支持最新一代Nvidia GPU加速器,包括Hopper与Blackwell架构,满足大规模模型推理及多模态处理需求。
安全性与治理为此方案核心,平台具备审计记录与访问控制功能,使企业可掌握进出本地人工智能环境的所有数据流量,以符合法规要求。GDC也支持机密计算,降低敏感数据在运行期间被篡改或泄露的风险。CPU端采用Intel TDX,GPU端则搭配Nvidia机密计算功能。
在模型与服务层面,GDC支持Gemini 2.5 Pro与Flash,同时整合Vertex AI的任务型服务,包括翻译、光学字符识别(OCR)、语音转文字及嵌入向量生成。此外,也支持Google开源Gemma模型,提供更灵活的部署选择。基础设施层则提供托管VM规格A3与A4,以及Kubernetes集群,允许企业在同一平台上运行开源或自行开发的模型,并通过Vertex AI的托管推理服务引擎与数据连接器简化上线作业。企业搜索方面,预览中的Agentspace搜索可在本地数据中建立统一搜索与问答体验。
企业可利用本地Gemini进行多语跨区协作、文档摘要、情绪分析及专有数据分析等功能,加速决策流程。也可在客服与内部支持中引入智能助手,或在软件开发场景中应用自动代码生成、智能补全与主动检测错误,以提升开发效率。在安全层面,则可借助人工智能协助内容过滤与政策合规,降低运营风险。