
微软
微软上星期公布Copilot AI助理新增多项代理人功能,包括深度研究(Deep Research)与搜寻、购物能力,并且具备为使用者执行多种任务。而帮用户读取萤幕内容的Copilot Vision也推向了Windows和行动版本。
微软AI部门主管Mustafa Suleyman在微软上周庆祝50周年时,宣布一系列Copilot功能。
Copilot Vision的电脑视觉能力可理解用户正在读取的萤幕内容,听取使用者指令动作。去年10月公布时只整合于Edge浏览器中,现在正式推向Windows版及手机Copilot应用程序。Windows版Copilot可操作多种应用程序、浏览器分析和文件,能读取文件,解答用户问题、翻译、摘录重点,提供分析洞见,或是搜寻、变更设定、组织文件、协同专案作业,完全不需开关文件或切换不同应用程序。而在手机上,Copilot Vision可以利用手机相机「看」周遭环境,或是分析手机串流的视讯或储存的相片。例如用户可以让它判断一下眼前的植物健康状态,以及建议如何照护,或是扫视办公室环境请它建议如何装饰。
现在Copilot Vision将先推给测试方案Insiders用户,之后逐步推向更多用户。手机版Vision将部署到iOS及Android版Copilot App。
微软也为Copilot AI助理加入多项代理人功能,包括当前最夯的Deep Research、Copilot Search in Bing、podcast等。一如Google Gemini、OpenAI ChatGPT,Copilot的Deep Research也可执行多步骤搜寻计画,搜寻网上来源及大量文件与图片,来完成複杂的研究任务。Copilot Search in Bing搜寻整合了传统搜寻及生成式搜寻,Bing会交叉比对多个网站提供更完整的回答,加入引用来源及进一步搜寻建议。
此外,现在Copilot也加入了类似Google NotebookLM中的Audio Overview的功能,它能分析用户提供的文件或网站资讯,并生成个人化podcast,为用户解释主题,例如解说旅游计画、新的休闲活动、困难专案或学校作业。当用户听取podcast时还能持续和Copilot对话互动。
其他代理人功能包括可帮用户研究及比较购物选项、并提供建议的Shopping、及将混乱想法整理成有系统文件的Pages。Copilot也提供Actions帮用户订表演票、订餐厅或上网下单,合作店家包括1-800-Flowers.com、Booking.com、Expedia、Kayak、OpenTable、Priceline、Tripadvisor、Skyscanner、Viator和Vrbo。
微软强调,随着用户和Copilot互动愈久,它会愈了解用户喜好而提供更精準而个人化的协助。该公司预告正在开发一项Google、OpenAI等其他大厂没有的个人化功能,允许用户选择Copilot外观,如动物、水果或其他拟人化造型。
?
?