logo
  • AI Image Generator
  • AI Chat
  • Nano Banana ProAD
  • Blog
Back to List
ADMIN
2026年3月7日
2 Views
8 min read

OpenAI 发布 GPT-5.4:原生电脑操作能力震撼登场,AI 时代正式进入新阶段

OpenAI 发布 GPT-5.4,原生支持电脑操作能力、百万 token 上下文窗口,AI 时代正式进入新阶段。本文详细解读这一重大更新的核心特性、实际表现以及对开发者和普通用户的影响。

昨天下午,当我习惯性地打开 Twitter 刷最新科技新闻时,一条推送让我直接从沙发上弹了起来 —— OpenAI 正式发布 GPT-5.4。

说实话,最近几年我们对「新模型发布」这种消息已经有点脱敏了。GPT-4、GPT-5、GPT-5.1、GPT-5.2...每一次升级都带来性能提升,但说实话,体感上的差距并不算特别明显。但这一次,情况完全不一样了。

真正的「电脑控制」来了

GPT-5.4 最让我震撼的不是参数量有多大,也不是上下文窗口有多长(虽然这也很重要,稍后细说),而是它原生支持「计算机使用」能力。

什么意思呢?简单说,现在的 GPT-5.4 不再只是跟你聊聊天、帮你写写代码,它可以像人类一样直接操作电脑了。点击按钮、填写表单、导航菜单、在不同应用之间切换......这些它都能自己搞定。

我在 OpenAI 官方博客上看到几个示例,真的让我头皮发麻:

  • 它可以打开你的电子表格,根据你的口头指令自动筛选数据、生成图表、导出报告
  • 它能帮你在线购物,从商品搜索到比价再到下单支付,全程不需要你动手
  • 它能帮你完成复杂的软件安装流程,那些让人抓狂的下一步下一步终于不用自己点了

一百万 token 的上下文窗口

再来说说另一个重磅更新:1M token 的上下文窗口。

这是什么概念呢?按照平均每页文档 500 字来算,相当于可以一次性「记住」约 20 万页的文档。如果你是程序员,把整个 GitHub 仓库丢给它,它能理解你的全部代码;如果你是法律从业者,把几百份合同丢给它,它能找出所有矛盾条款;如果你是写小说的,把你之前写的一百章全塞进去,它能保持人物设定的一致性。

OpenAI 的技术博客提到,GPT-5.4 在某些任务上比前代减少了 47% 的 token 使用量。这意味着什么?同样的钱,能做更多的事;或者更准确地说,做同样的事,花的钱更少了。

性能提升究竟有多明显?

作为一名写了十年代码的老程序员,我对 AI 的代码生成能力特别敏感。从 ChatGPT 时代开始,我就一直在用 AI 辅助编程。说实话,GPT-4 时代已经能解决 70-80% 的问题,但剩下那些复杂的多步骤任务,还是经常卡壳。

GPT-5.4 的表现怎么样?我第一时间申请了体验名额,简单试了几个场景:

  • 代码重构:让它重构一个 2000 行的旧项目,它不仅识别出了所有的代码坏味道,还自动补全了缺失的单元测试,整个过程只用了 3 分钟
  • 调试:给了一段报错信息,它不仅给出了正确的修复方案,还解释了问题的根本原因,甚至建议了如何避免将来遇到类似问题
  • 多文件操作:让它帮忙把一个前端项目从 Vue 2 升级到 Vue 3,涉及几十个文件的修改,它全程自己搞定,我只负责检查和提交代码

当然,这些测试都很主观。但从 OpenAI 公布的基准测试数据来看,GPT-5.4 在代码能力上确实有了显著提升。这对于靠写代码吃饭的人来说,绝对是福音。

价格和可用性

说到价格,OpenAI 这次没有公布详细的定价信息,只提到 GPT-5.4 Thinking 版本已经向 ChatGPT 用户开放,GPT-5.4 Pro 将逐步向 Pro 用户推出。

不过从官方强调的「效率提升」来看,我猜测单次调用的价格可能会比 GPT-5.2 稍高一些,但由于 token 使用量的降低,整体成本可能会持平甚至更低。这只是我的猜测,具体还要等官方公布详细信息。

我的思考

写到这里,我忍不住想问自己一个问题:我们距离 AGI 还有多远?

GPT-5.4 的「电脑操作」能力,某种程度上意味着 AI 已经不再是被动地等待指令,而是能够主动地与环境交互、完成复杂的多步骤任务。这和人类的思维模式越来越接近了。

但我同时也感到一丝不安。当 AI 能够自己操作电脑、执行任务时,我们要如何确保它的行为符合我们的意图?当上下文窗口达到百万级别时,模型会产生什么样的「涌现行为」?这些问题还没有清晰的答案。

写在最后

无论如何,GPT-5.4 的发布标志着 AI 技术又迈上了一个新台阶。原生电脑操作、百万级上下文、更强的推理能力......这些功能的组合拳,可能会在接下来几个月彻底改变我们的工作方式。

作为一名科技从业者,我既兴奋又期待。兴奋是因为又能玩到新玩具了,期待是因为这个领域的进化速度真的太快了,你永远不知道下一次更新会带来什么惊喜。

如果你也有机会体验 GPT-5.4,欢迎在评论区分享你的感受。让我们一起见证这个时代的变化。