
Google在云端年会中揭露客服代理新功能,不只能用更拟人的语音回覆使用者问题,还结合镜头画面辨识能力,即时查看使用者手中物品,如盆栽,并自动推荐合适的产品。(图片来源/Google)
今年度Google Cloud Next大会聚焦AI代理新战略,除了新添低门槛开发工具、互通协定来供企业打造多代理生态,还建置开箱即用的现成代理应用,瞄準客服、创意、资料科学、程序开发、资安等5大领域,另也针对办公生产力,推出代理加持的工作流程自动化服务。
代理领域1:客服
Google云端首先亮相的是新一代顾客参与套件(Customer Engagement Suite)。这个套件原本就提供开箱即用的功能,可根据企业数据快速建置代理,这些数据可以是网路资料、行动装置资料、客服资料,也可以是实体店内资料、第三方电信资料以及内部CRM系统资料。
而这次的新一代套件,将提供更拟人的高解析度语音、情绪理解能力,来让AI代理更好地与人对话,另还有支援串流影片的功能,来让代理透过顾客端设备即时解释或回应所看到的内容。再来,这个套件还提供AI助手,来协助使用者在无程序码介面打造客製化的AI代理。
同时,Google还针对特定产业打造垂直式代理,来改善客服以外的顾客对话体验,如食品订购、汽车和零售等。其中,美国的温蒂汉堡就用这个套件打造AI得来速订餐系统,每天处理了6万份订单,又或是宾士在其最新的CLA车型中,新添对话式搜寻和导航功能。
代理领域2:创意
另一方面,Google云端也介绍自家既有的创意代理(Creative Agents),专门用来提高创意团队的表现,像是媒体行销、广告、设计等,甚至用于大规模的创意内容製作。
同时,这些创意代理还正优化对观众讲故事的能力。Google透露,他们自己在行销团队的带领下,就用创意代理来打造秋季Pixel手机广告活动。而食品製造商Mondelez,也用这项工具来替旗下品牌Oreo进行内容和创意设计。
Google云端也联手Adob??e,将自家图像生成模型Imagen 3、影片生成模型Veo 2等导入Adob??e Express等应用程序,来供创作使用。
代理领域3:资料处理
另一大代理亮点是资料代理(Data Agents),Google云端特别点出,这次在自家资料处理平台BigQuery中新推的资料代理,能满足资料团队每位成员的工作需求。
比如,对资料工程团队来说,资料代理可协助建立资料管线、进行资料前处理(如转换格式和增强资料),还能透过异常检测来维护资料品质,并能自动产生诠释资料(Metadata)。
对资料科学团队来说,Google云端的资料代理还能自动化特徵工程、提供智慧模型选择、扩展模型训练规模,以及加速模型迭代。
对于资料分析和业务角色而言,Google云端也有套对话分析代理程序,可完全使用自然语言,来执行强大可靠的分析。使用者也能将代理程序嵌入到自己的Web或行动应用程序中。
不少企业已经先使用这些代理功能,比如拜耳打造一个代理,结合Google搜寻趋势和内部数据来预测流感趋势、改善公共卫生态势。又或是美国内华达州等公共部门,正在利用代理来加速福利申请。
代理领域4:程序开发
Google云端代理应用还瞄準程序开发,在原本的程序码助手Gemini Code Assist中新添了代理,目前为私人预览版,来辅助程序码现代化到整个软件开发生命周期的所有工作。开发者除了能在看版中使用Code Assist代理,还能在Google第三方合作平台中使用,比如Atlassian、Sentry、Snyk等。
Google自己还透露,他们内部超过25%的新上架程序码,已经由AI产出并经工程师审查。
代理领域5:安全
Google云端的代理应用,还更深入到资安领域,在今年大会中宣布多项新应用,比如警报分类代理,能代表使用者执行动态调查、分析每个警报的上下文,收集相关资讯并对警报做出判断,同时提供代理判断的依据和决策历史。
又或是恶意软件分析代理,能调查程序码是否安全或有害。这款代理以Code Insight为基础,来分析潜在的恶意程序码,还具备建立和执行反混淆脚本的能力。
在这个领域,Google云端还揭露Google统一安全解决方案,整合了Google自家的视觉工具、威胁侦测、AI驱动的安全作业、持续虚拟红队功能,以及企业浏览器和Mandiant专业知识,形成一个全域规模的整合式解决方案。
除了5大领域的代理应用,Google云端还推出一项实用的自动化流程工具Google Workspace Flows,使用者用自然语言描述想完成的流程,内建的AI代理就会自动设计整个逻辑流程,不必写程序就能完成跨应用的工作自动化。
?Google云端AI代理战略的底层火力?
Google云端在今年度Next大会中,揭露一张架构图,来说明他们的AI代理堆叠。这个架构图包含4层,由下而上依序是底层的AI基础设施AI Hypercomputer、中层的模型层和工具层Vertex AI,以及最上层的代理应用层。
虽然年会亮点大都聚焦在工具层和代理应用层,但底层和模型层也很重要,是AI代理不可或缺的发动力。就AI超级电脑架构AI Hypercomputer来说,专门提供强大算力资源和调度功能,来让代理「跑得动」,今年的一系列更新以第七代张量处理器(TPU)Ironwood打头阵,这款TPU专为「会思考」的模型设计,比如大型语言模型(LLM)、混合专家(MoE)模型、推理模型,这类模型通常需要大量的平行处理和高效能的记忆体存取。
而Ironwood的每个晶片峰值运算能力为4,614 TFLOPs,可因应繁重的AI工作负载,且Ironwood有两种晶片配置(256个晶片和9,216个晶片),当扩展到9,216个晶片时,其运算能力可达42.5 exaFLOP,是全球最大超级电脑El Capitan的24倍之多,适合用来执行複杂的AI模型。
也因此,Google用Ironwood来优化AI超级电脑架构,提供更强大、高效能的运算资源给用户。除此之外,AI超级电脑架构也有其他软硬件更新,像是更好的丛集管理服务Cluster Director、更好的GKE推论能力等,如GKE Inference Gateway、Pathways on GC、vLLM on TPU等,来供使用者训练和执行模型。
AI基础设施的更新还有一项网路基础设施新服务Cloud WAN,来提供高效能的网路连接,供企业因应AI应用带来的高度分散网路需求。
模型层则有Google云端用来驱动AI代理的多款模型,它们能处理多种资料类型(即多模态),成为AI代理背后的能力来源。除了自家Gemini系列模型,Google还对既有模型进行优化,像是替文字转影片模型Veo 2增添新功能,如镜头控制、影片编辑工具,使用者能更细緻地调整影片内容、快速重製和优化。
又或是替文字转语音模型Chirp 3新添客製化功能,使用者只需提供10秒音讯,就能生成专属声音模型。此外,Chirp 3 还支援AI配音叠加至既有录音,还有辨识说话者的语音转录功能。
同时,Google也优化了图片生成模型Imagen 3的品质,让图像中缺失或不自然的处理更细腻自然,尤其在物件移除和修图场景中,能更自然呈现。
除了既有模型,Google在今年大会,还揭露新纳入的音乐生成模型Lyria,只要输入文字提示,就能转换为30秒的音乐片段。以上就是Google云端提供AI代理的重要基底。