OpenAGI发布革命性AI应用模型Lux:1秒完成任务,成本降低10倍
今天,OpenAGI正式推出其首款专为计算机操作设计的基础模型——Lux。这不是又一个聊天机器人,而是一个能像人类一样“用电脑”的AI代理:它能自动打开浏览器、填写表单、点击按钮、切换标签页、下载文件,甚至处理复杂的多步骤网页任务。更重要的是,它做到了别人做不到的事——每个任务平均仅耗时1秒,是当前主流模型的三分之一,运行成本更是直降90%。
在业内权威的在线交互基准测试“Online-Mind2Web”中,Lux以83.6分的高分遥遥领先:超越谷歌Gemini CUA(69.0)、OpenAI Operator(61.3)和Anthropic Claude Sonnet 4(61.0),成为目前全球在真实网站环境中任务完成率最高的AI代理模型。这意味着,它不只是“看起来聪明”,而是真能在亚马逊下单、在LinkedIn发帖、在Airbnb预订酒店、在Notion整理数据时,稳定、准确、快速地完成操作。
不是“读网页”,是“用电脑”:Agentic Active Pre-training颠覆传统训练方式
传统大模型靠“看”互联网文本学习知识,而Lux靠“做”来成长。OpenAGI首创的Agentic Active Pre-training(主动代理预训练)技术,让Lux在成千上万个模拟的虚拟操作系统中,像真人一样不断试错、探索、失败、再尝试。它不是被动地记住“如何搜索”,而是亲身经历过“搜索失败后怎么改关键词”、“弹窗挡住了按钮怎么办”、“登录失败后是重试还是换账号”——这些真实世界的细节,才是高效自动化的核心。
这种训练方式,让Lux具备了前所未有的“环境适应力”。它不依赖预设脚本,也不怕网页改版——因为它的能力是“学会怎么用电脑”,而不是“背下某个页面的结构”。
三种模式自由切换,开发者想怎么用就怎么用
Lux不是“一刀切”的工具,而是为不同场景量身打造的智能助手:
- Actor模式:每步响应仅1秒,专为清晰指令设计。比如“打开Chrome,登录企业邮箱,下载附件A,转发给张三”。适合自动化重复性操作,效率远超RPA。
- Thinker模式:面对模糊目标时,它会自己拆解任务。比如“帮我整理上个月的销售数据,做个趋势图发给团队”——它会自动找文件、提取数据、生成图表、写邮件、发送,全程无需人工干预。
- Tasker模式:进阶开发者可直接输入Python代码片段,逐行控制执行流程,支持动态重试、异常捕获和条件分支。适合构建复杂工作流,如自动抓取竞品价格、监控库存、触发补货提醒。
开源OSGym:让每个开发者都能训练自己的AI代理
OpenAGI没有把技术锁在内部。为推动AI代理生态发展,他们已开源训练引擎OSGym——一个能同时运行数千个真实操作系统副本、自动生成海量交互数据的分布式平台。开发者现在可以:
- 用自己的数据训练专属AI代理
- 模拟电商、金融、政务等专业场景
- 测试AI在复杂网络环境下的鲁棒性
OSGym已在GitHub开放,支持Docker一键部署,社区已有超过3000名开发者参与测试。有人用它训练AI自动处理客服工单,有人用来测试银行网页的反爬策略,还有高校团队用它研究AI在多任务环境中的决策机制。
谁在用Lux?真实场景正在爆发
从内测用户反馈来看,Lux已在多个领域展现出颠覆性价值:
- 电商运营:自动监控100+店铺的库存、价格变动,触发补货提醒,比人工巡检快20倍。
- SEO与内容管理:自动发布文章、提交站点地图、检查404链接、分析关键词排名,一天完成过去一周的工作量。
- 数据录入与迁移:从PDF、扫描件、旧系统中提取信息,自动填入新CRM,准确率超98%,错误率低于人工。
- 软件测试:替代人工执行UI自动化测试,覆盖登录、支付、注册等全流程,测试周期从小时级缩短至分钟级。
现在就能体验
Lux已通过官方SDK向全球开发者开放,提供免费试用额度。无论你是独立开发者、初创公司,还是企业IT团队,都可以在openagi.ai/lux注册,3分钟内启动你的第一个AI代理。
这不是未来的趋势——这是现在就能用上的生产力革命。