最新消息:关注人工智能 AI赋能新媒体运营

微软发布Fara-7B:轻量级AI模型可自主操作电脑

科技资讯 admin 浏览

微软推出Fara-7B:能“看图操作”的轻量AI助手,本地运行不依赖云

微软近日正式发布Fara-7B——一款专为自动化网页操作设计的轻量级AI模型。与传统需要调用云端大模型、依赖API接口或网页结构解析的工具不同,Fara-7B 只有70亿参数,却能像真人一样“看截图、点按钮、填表单、滚动页面”,直接在本地设备上完成复杂任务,无需联网、不依赖网站配合,隐私与效率双双提升。

不靠代码,靠“视觉”完成任务

过去,自动化工具如Selenium或Playwright需要开发者编写精确的CSS选择器、XPath路径,一旦网页改版就容易失效。而Fara-7B完全跳过这一层——它接收网页截图作为输入,通过视觉识别理解页面布局,自主判断“哪里是搜索框”“哪个按钮是‘立即购买’”,再模拟鼠标点击、键盘输入、滚动翻页等操作,就像你坐在电脑前手动操作一样。

实测中,它能独立完成:在电商平台比价后下单游戏手柄、在GitHub上查找某个开源项目的最新提交记录、规划通勤路线并推荐沿途咖啡店、甚至在招聘网站筛选并投递职位。每一步操作都会暂停,等待用户确认,避免误操作,安全性远超传统脚本。

性能碾压“大模型”,本地跑得动

尽管参数只有70亿,Fara-7B在多个权威基准测试中表现惊人:

  • WebVoyager中任务完成率达62%(经Browserbase第三方人工评估)
  • Online-Mind2WebDeepShop中超越GPT-4o、Claude 3等更大模型
  • 在微软自研的WebTailBench中,首次实现对“无标准答案”任务(如比价、订票、找兼职)的系统性评估,Fara-7B 成为首个在此榜单登顶的轻量模型

更重要的是,它能在普通笔记本甚至Copilot+ PC上本地运行,无需GPU加速,内存占用低于4GB,启动延迟小于1秒。这意味着你不再需要依赖云端API、支付调用费用,或担心数据被上传。

开源免费,开发者可立即上手

Fara-7B 已在 Hugging Face 和微软的 Microsoft Foundry 平台开源,采用宽松的MIT许可证,商用无需授权。微软还提供了经过量化压缩的Windows版本,专为Copilot+ PC优化,一键安装即可使用。

对普通用户来说,你可以用它自动填写报销单、批量下载论文PDF、监控商品价格变动;对开发者而言,它是一个强大的自动化引擎,可快速集成进办公助手、客户支持机器人、数据抓取工具等场景。

安全提醒:请在沙盒中使用

由于Fara-7B能直接控制浏览器、输入账号密码、提交表单,微软明确警告:目前仍属实验性工具,切勿在涉及银行、支付、身份证件等敏感操作的环境中直接运行。建议在虚拟机、Windows Sandbox或专用测试账户中使用,避免潜在风险。

目前,微软已开放社区反馈通道,用户可通过GitHub提交任务失败案例、改进建议。随着模型迭代,未来或将支持多窗口操作、跨站跳转、语音指令联动等能力。

未来已来:AI不再是“问答机器人”,而是你的“数字员工”

Fara-7B的出现,标志着AI从“回答问题”正式迈向“执行任务”的新阶段。它不是替代你,而是帮你把重复、繁琐的网页操作从日程中抹去——每天省下30分钟填表、查物流、比价格,一年就是上百小时。

如果你厌倦了写脚本、被网页改版折磨,或者想让AI真正“动手”而不是“动嘴”,Fara-7B可能是你今年最值得尝试的AI工具之一。现在就去Hugging Face下载,亲手让它帮你完成第一个网页任务吧。