2026-03-06 12:27:04

GPT-5.4原生操控电脑才能实测冷艳,OpenClaw迎来最强同伴

摘要

深夜，OpenAI悄然发布了一款名为GPT-5 4的新模型，引发科技圈广泛关注。这款模型的最大亮点在于首次实现了原生电脑操控能力，无需借助外部

深夜，OpenAI悄然发布了一款名为GPT-5.4的新模型，引发科技圈广泛关注。这款模型的最大亮点在于首次实现了原生电脑操控能力，无需借助外部框架或适配层，可直接通过识别屏幕内容、模拟鼠标点击和键盘输入，像人类用户一样操作桌面环境中的各类软件。

实测显示，GPT-5.4在MacBook设备上展现了惊人的操作能力。用户只需通过自然语言指令，模型即可调起日历应用设置提醒、打开特定APP播放节目、操作计算器完成复杂计算，甚至更换电脑壁纸或调用终端执行代码。在OSWorld-Verified基准测试中，该模型以75.0%的成功率超越人类平均水平（72.4%），成为首个在真实桌面环境中表现优于普通用户的通用AI模型。这一数据对比GPT-5.2的47.3%成功率，凸显了其操控能力的飞跃式提升。

开源个人AI助手项目OpenClaw的创始人Peter Steinberger指出，GPT-5.4的原生操控能力与OpenClaw的核心理念完美契合。该项目强调“AI不仅要聊天，更要干活”，而此前模型能力不足导致的任务卡顿、工具调用成本高等问题，在GPT-5.4身上得到根本解决。其100万Token的上下文窗口支持长程任务保持，Tool Search机制按需调用工具定义，使OpenClaw的运行效率提升47%，API费用大幅降低。配合模型在编程、数学、文档处理等领域超过83%人类专家水平的推理能力，OpenClaw从“自动补全工具”升级为真正的“赛博秘书”。

行业专家对GPT-5.4给予高度评价。HyperWriteAI首席执行官Matt Shumer认为这是“目前世界上最好的模型”，其在标准模式下的表现已超越此前专业版，编程能力更是“近乎完美无瑕”。Mercor AI首席执行官Brenda则断言，该模型将超越顶尖咨询公司、投行和律所的专业能力，覆盖人类精英金领的所有工作场景。OpenAI科学家Sebastien Bubeck用梗图展示其编程能力提升时，社区开发者实测发现，低端模型与GPT-5.4运行OpenClaw的体验差距可达40%至95%，验证了“模型即产品”的社区共识。

技术底层逻辑的切换引发更深层思考。过去AI竞争聚焦于模型参数规模，而GPT-5.4的发布将话题转向“AI能做什么、能完成什么、能替代什么”。当模型操控电脑熟练度超越普通用户，专业任务匹配行业专家时，个人AI员工从概念到现实的路径已清晰可见。OpenClaw官方文档已提供GPT-5.4接入配置方案，首批用户正在社区分享使用体验，一场由模型能力驱动的生产力革命正在悄然发生。

声明：文章不代表轻松科技观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！