最新消息:关注人工智能 AI赋能新媒体运营

GPT-5.4 发布:开启透明思考,支持百万Token窗口与原生电脑操作,AI智能体时代到来

科技资讯 admin 浏览

GPT-5.4 正式发布:不只是更聪明,而是真正能帮你干活

2026年3月5日,OpenAI 正式推出 GPT-5.4 —— 这不是一次简单的升级,而是一次从“回答问题”到“完成任务”的根本转变。它不再只是坐在屏幕另一端等你提问的助手,而是能主动拆解任务、查资料、写代码、操作软件,甚至帮你把一整份季度财报分析完、再生成PPT汇报稿的“数字搭档”。

现在,当你在 ChatGPT 网页端或 App 里开启“思考模式”,你会看到它先列出一个“工作计划”:比如“第一步,查近三年苹果公司供应链成本数据;第二步,对比三星和富士康的报价趋势;第三步,用Excel建模预测下季度毛利变化”。你可以随时打断,说:“等等,别管富士康了,重点看越南工厂的产能。”它立刻调整方向,不固执、不套路,像一个靠谱的实习生,懂你的意图,也愿意听你的意见。

HCqs0sHaEAA0j8l.png

编程、办公、分析,一锅端

GPT-5.4 把过去独立的 Codex 编程能力彻底融合进来。你不用再在代码编辑器和聊天窗口之间来回切换。写个Python脚本自动整理Excel里的客户数据?直接说:“把这份销售表里重复的客户合并,按地区算平均订单额,导出成CSV。”它能自己读懂表格结构,写好代码,运行,输出结果,甚至告诉你哪行数据可能有问题。

对办公软件的优化不是噱头。在PPT里,它能根据你提供的要点,自动生成逻辑清晰的幻灯片结构,连配色和图表风格都自动匹配公司模板。在Excel里,它能识别你手写的公式意图,纠正错误的单元格引用,甚至提醒你:“这个VLOOKUP如果数据源有空值,可能漏掉23条记录。”

事实错误率比上一代降低18%,虚假陈述减少33%——这不是实验室数据,是真实用户在金融、法律、医疗报告场景中反馈的结果。一位硅谷投行分析师告诉我:“现在我让GPT-5.4帮我读10份10-K年报,它能标出关键风险点,比我们初级分析师干得还细。”

它能“操作电脑”了——不是模拟,是真操作

最让人惊讶的,是它开始能“看屏幕”和“动鼠标”。在安全的测试环境里,GPT-5.4 可以:打开浏览器,登录你的企业邮箱,下载附件,打开Excel,筛选数据,复制到Word,再发一封邮件给团队。你不需要写自动化脚本,也不需要安装插件。你只要说:“帮我把上周的会议纪要整理成行动项,发给所有参会人。”它就能完成。

这项能力不是靠“调API”实现的,而是模型直接理解界面元素:按钮在哪、表格怎么读、弹窗怎么关。它能处理跨应用的复杂流程——比如从Slack收到一个任务,自动打开Jira创建工单,再在Notion里更新进度,最后在Outlook里设置提醒。

支撑这一切的是高达100万Token的上下文窗口。这意味着它可以一次性读完一本500页的技术手册,或者整个公司的财务系统导出的12个月数据。你不用再分段上传、反复提醒“前面那段内容”。它记得住,还能在几天后继续你没做完的分析——比如“昨天你让我对比三家供应商,今天我找到了新数据,要不要更新模型?”

谁该用 GPT-5.4 Pro?

标准版已经够强,但如果你是:

  • 每天要写代码、调数据、做报告的开发者
  • 需要处理大量合同、财报、研报的律师或分析师
  • 管理多个项目、总在协调不同工具的项目经理

那你应该试试 GPT-5.4 Pro。它支持“高推理强度”模式——不是更快,而是更深入。它会花更多时间验证假设、反向推演、找漏洞。一位AI研究员用它设计新算法,模型连续工作了17小时,提出了3种被论文忽略的优化路径,其中一种被成功实测,提升了32%的训练效率。

目前,GPT-5.4 和 GPT-5.4 Pro 已对 ChatGPT Plus、Team 和 Enterprise 用户开放,API 也同步上线。你不需要等“公测”,现在就能用。它不炫技,不卖概念,只是安静地、可靠地,替你把那些重复、琐碎、烧脑的活儿,一件件做完。

你不再是在“问AI”,你是在“指挥一个能干的同事”。