深夜,OpenAI悄然发布了一款名为GPT-5.4的新模型,引发科技圈广泛关注。这款模型的最大亮点在于首次实现了原生电脑操控能力,无需借助外部框架或适配层,可直接通过识别屏幕内容、模拟鼠标点击和键盘输入,像人类用户一样操作桌面环境中的各类软件。这一突破性进展被视为AI领域的重要分水岭,标志着智能体技术从“对话交互”向“任务执行”的跨越。
实测显示,GPT-5.4在MacBook设备上展现了惊人的操作能力。用户只需通过自然语言指令,模型即可调起日历应用设置提醒、打开特定APP播放节目、操作计算器完成复杂计算,甚至更换电脑壁纸或调用终端执行代码。在OSWorld-Verified基准测试中,该模型以75.0%的成功率超越人类平均水平(72.4%),成为首个在真实桌面环境中表现优于普通用户的通用AI模型。这一数据对比GPT-5.2的47.3%成功率,凸显了其操控能力的飞跃式提升。
开源个人AI助手项目OpenClaw的创始人Peter Steinberger指出,GPT-5.4的原生操控能力与OpenClaw的核心理念完美契合。该项目强调“AI不仅要聊天,更要干活”,而此前模型能力不足导致的任务卡顿、工具调用成本高等问题,在GPT-5.4身上得到根本解决。其100万Token的上下文窗口支持长程任务保持,Tool Search机制按需调用工具定义,使OpenClaw的运行效率提升47%,API费用大幅降低。配合模型在编程、数学、文档处理等领域超过83%人类专家水平的推理能力,OpenClaw从“自动补全工具”升级为真正的“赛博秘书”。
行业专家对GPT-5.4给予高度评价。HyperWriteAI首席执行官Matt Shumer认为这是“目前世界上最好的模型”,其在标准模式下的表现已超越此前专业版,编程能力更是“近乎完美无瑕”。Mercor AI首席执行官Brenda则断言,该模型将超越顶尖咨询公司、投行和律所的专业能力,覆盖人类精英金领的所有工作场景。OpenAI科学家Sebastien Bubeck用梗图展示其编程能力提升时,社区开发者实测发现,低端模型与GPT-5.4运行OpenClaw的体验差距可达40%至95%,验证了“模型即产品”的社区共识。
技术底层逻辑的切换引发更深层思考。过去AI竞争聚焦于模型参数规模,而GPT-5.4的发布将话题转向“AI能做什么、能完成什么、能替代什么”。当模型操控电脑熟练度超越普通用户,专业任务匹配行业专家时,个人AI员工从概念到现实的路径已清晰可见。OpenClaw官方文档已提供GPT-5.4接入配置方案,首批用户正在社区分享使用体验,一场由模型能力驱动的生产力革命正在悄然发生。