最新消息:关注人工智能 AI赋能新媒体运营

谷歌DeepMind为AI时代重塑沿用60年的鼠标光标

科技资讯 admin 浏览

Google DeepMind于周二(5月12日)宣布,正在开发一款由AI驱动的新型智能光标Magic Pointer。这项技术有望改变半个世纪以来几乎未曾变化的鼠标交互方式,让光标不仅能“看到”用户指向的位置,更能理解其意图与上下文。这一全新的Magic Pointer功能将整合至Chrome浏览器与Google Book笔记本电脑,目前可在Google AI Studio平台试用。

Google DeepMind表示,现有AI工具大多独立于专属窗口,用户操作繁琐且会打断工作流程。Magic Pointer的目标是让AI自然融入所有应用程序,用户无需“绕路”,只需指向、点击或语音指令,AI即可实时响应,保持工作连续性。

Magic Pointer采用Gemini模型,能自动捕捉光标周围的视觉与语义上下文,使电脑理解用户指向的词句、图像局部或代码。它结合“指向+语音”的自然交互方式,将屏幕上的像素转化为可操作的实体,例如将照片中的手写便签自动转换为待办事项清单。

Gemini模型的多模态能力使Magic Pointer能够实时解析屏幕上的视觉与文字信息。系统会根据光标位置自动识别用户关注的目标类型,如日期、地址、商品或人物,并在后台完成语义理解与响应准备,全程无需用户输入任何提示词。

Magic Pointer的操作极为简便,用户只需将鼠标光标移至目标对象上,无需点击左键或右键,直接语音说出需求即可。例如在Chrome中,光标指向产品图片后说“和页面上其他类似产品比较”,系统将自动分析;或指向客厅照片说“把这个沙发放在这里”,即可实时合成模拟画面。在Google Book上,指向邮件中的日期说“添加到日历”,或指向PDF文件说“总结内容”,全程无需框选、打字或撰写任何提示词。

首批搭载Magic Pointer的Google Book预计于2026年秋季上市,合作厂商包括宏碁、华硕、戴尔、惠普与联想五大品牌。除了Google Book,Google也正逐步将Magic Pointer集成到Chrome浏览器中,让用户无论在何种设备上都能享受“指向即交互”的AI体验。