2026-03-14 17:20:41

Codex不计划让Claude Code好过

摘要
作者|周一笑2月6日,OpenAI总裁Greg Brockman在X上公开发了一条面向全公司工程团队的帖子,设了一个deadline:到3月31日,任何技术任务,...

作者|周一笑

2月6日,OpenAI总裁Greg Brockman在X上公开发了一条面向全公司工程团队的帖子,设了一个deadline:到3月31日,任何技术任务,工程师的第一工具应该是agent,而不是编辑器或终端。

这是OpenAI对自己下的动员令。

如果只看这句话,你可能会觉得又是一条硅谷式的愿景声明。但接下来六周发生的事情表明,Brockman不是在喊口号。OpenAI的Coding Agent平台Codex,正在经历一轮罕见的产品冲刺,密度之高,节奏之快,甚至让一些长期关注AI编码工具的开发者开始重新审视自己的工具链。

与此同时,Codex在程序员群体中的热度和口碑也在肉眼可见地上升。

一切动作都指向“狙击”Anthropic 如日中天的Claude Code。

六周的疯狂迭代

拉一下时间线就能感受到这个节奏。

2月2日,Codex桌面App发布(macOS),OpenAI同时宣布向ChatGPT免费和Go用户开放Codex,所有付费用户的速率限制翻倍。

2月5日,GPT-5.3-Codex发布,OpenAI称它为"第一个帮助创造了自身的模型"。同一天,Anthropic发布Claude Opus 4.6。

2月12日,Codex-Spark发布,与AI推理硬件公司Cerebras合作,推理速度超过每秒1000 tokens。OpenAI的说法是,“当模型能力越来越强,交互速度就成了明确的瓶颈。”

2月14日,OpenClaw创始人Peter Steinberger宣布加入OpenAI。据报道,Steinberger用Codex编写了OpenClaw的全部代码,偏好长时间运行的agentic loop。Sam Altman在X上称他为“天才”,说他将“推动下一代personal agents”。

3月4日,Codex桌面App登陆Windows。

3月5日,GPT-5.4发布,是OpenAI第一个同时具备reasoning、coding和原生computer use能力的通用模型,在Codex和API中支持100万token上下文。

3月6日,Codex Security进入research preview。这是OpenAI推出的应用安全代理,前身为内测阶段的Aardvark,能够分析代码仓库、构建项目级威胁模型、在沙盒中验证漏洞并提出修复建议。过去30天的beta测试中,它扫描了超过120万次commits,发现792个critical级别漏洞和超过10000个高危问题,覆盖OpenSSH、GnuTLS、Chromium等重量级开源项目。误报率降低超过50%,噪音降低84%。

使用数据报道,Anthropic的Claude Code已经做出25亿美元的年化收入,占其企业收入的一半以上。Claude Code用真金白银证明了Coding Agent可以成为AI公司的核心收入引擎。对于估值据报道。其中最引人注目的事实是,Codex超过90%的代码是由Codex自己编写的。Anthropic方面也有类似的说法,Claude Code的创建者Boris Cherny告诉Orosz,Claude Code的数据报道描述了一种新的工作方式,Codex团队的典型工程师同时运行4到8个并行agent,分别处理feature开发、code review、安全审计、代码库理解、bug修复等任务。工程师的角色正在从写代码的人变成管理agent的人。

技术选型上,Codex CLI选择了Rust(Claude Code使用的是Typescript)。团队负责人Tibo给出的理由不仅是性能和正确性,还有工程文化,选择Rust是为了给团队设定一个高工程标准,同时减少对npm依赖生态的依赖。他们甚至招募了Rust终端UI库Ratatui的维护者全职加入团队。

更值得关注的是分层代码审查机制。Codex团队训练了一个定制的code review模型,据Tibo说约9/10的评论能指出有效问题。审查分两层,非关键代码在AI review后可以直接merge,核心agent代码和开源组件仍然要求强制人工审查。这套机制的意义在于,审查本身开始分层了。

还有两个细节能说明Codex正在从工具走向系统。Codex可以运行自己的完整测试套件来测试自身;团队还设置了夜间巡检,让Codex自动扫描代码库并生成待审修复建议,工程师每天早上进公司时就有一批修复等着review。

一家名为Wonderful的AI开发公司的首席架构师在今年3月写了一篇文章,描述了他们四个月前禁止手动coding后的经验。他对两个工具的定位是,Codex是坐在房间后面戴耳机的工程师,默默读完你整个代码库15分钟才写第一行代码,Claude则更有产品感,更擅长判断什么感觉对。他们把Codex用于低延迟系统工作、实时语音管线、性能敏感代码,Claude则用于UI和前端。

从coding工具到Agent平台

拉远来看,Codex六周冲刺的方向指向一个更大的野心。

Peter Steinberger的加入是一个人事信号。他日常同时并行5到10个agent,加入OpenAI后的方向是下一代personal agents,不是coding工具。OpenAI正在用Codex作为agent战略的入口。

Codex Security则是另一个方向的延伸。当Codex从帮你写代码走向帮你审计安全,它的定位就已经变了。

GPT-5.4进一步加速了这个转变。作为OpenAI第一个具备原生computer use能力的通用模型,它在Codex中不仅能写代码,还能操作电脑、跨应用执行工作流。配合正在成型的插件/skills生态系统和企业级权限管理,Codex的轮廓越来越像一个AI原生的开发平台。

Codex团队在Every的播客中透露了他们眼中的下一个瓶颈,就是代码审查。

模型生成代码的速度已经远超人类review的速度,验证产出的正确性成了最紧迫的问题。他们已经在尝试让模型通过重现用户操作路径来“证明”修复有效,而不是让人类逐行读代码。

这些野心和Claude Code已经越来越清楚的发展方向有很多重合,在从Claude Code那里迅速抢走了一些用户和使用场景之后,Codex的势头正在起来。回到Greg Brockman 2月6日的那条帖子。他设的deadline是3月31日,目前距离deadline还有两周多,而从过去六周的节奏来看,Codex的冲刺还远没有结束。

OpenAI把曾经在模型上呈现出的狠劲儿和卷王的气质,都放到了Codex上,接下来它和Claude code之间短兵相接的故事,会更精彩了。

声明:文章不代表轻松科技观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!
热门新闻
热门百科
回顶部