OpenAI 于 3 月 6 日推出了 Codex Security,推出了一款由人工智能(AI)驱动的应用安全代理,能够扫描 Github 仓库中的漏洞,仅在 Anthropic 推出其竞争对手 Claude Code Security 工具几周后——将 AI 驱动的代码防御转变为科技行业最新的竞争战场。
该发布正值对能够比人类安全团队更快扫描庞大软件项目的 AI 工具日益增长的兴趣之中。Codex Security 旨在分析仓库,识别漏洞,在隔离的测试环境中验证漏洞,并提出开发者可以在应用前审查的修复方案。该系统逐步构建上下文,允许 AI 理解代码的演变,而不仅仅是标记孤立的片段。
OpenAI 表示:
“我们推出了 Codex Security。这是一款应用安全代理,帮助你通过发现漏洞、验证漏洞并提出修复方案来保护你的代码库,你可以审查和修补。现在,团队可以专注于重要的漏洞,更快地发布代码。”
OpenAI 表示,该工具建立在其 Codex 生态系统之上,Codex 是于 2025 年 5 月推出的云端 AI 工程助手,帮助开发者编写代码、修复漏洞并提出拉取请求。根据公司数据,到 2026 年 3 月,Codex 的使用量已升至每周约 160 万用户。Codex Security 将这些能力扩展到应用安全领域,这是一个估计每年产生约 200 亿美元的行业细分市场。
OpenAI 的公告发布之际,还推出了 GPT-5.3 Instant 和 GPT-5.4。此举也紧随 Anthropic 于 2 月 20 日推出的 Claude Code Security,该工具扫描整个代码库并为检测到的漏洞建议补丁。该工具基于 Claude Opus 4.6 模型,试图像人类安全研究员一样推理软件——分析业务逻辑、数据流和系统交互,而不仅仅依赖静态扫描规则。
Anthropic 表示,Claude Code Security 已经在开源软件项目中识别出超过 500 个漏洞,包括一些多年来未被注意到的问题。公司目前在企业和团队客户中提供研究预览版,而开源维护者可以免费请求加快访问权限。
两家公司都押注于能够理解代码上下文的 AI 系统将优于传统漏洞扫描器,后者常常产生大量误报。为解决这一问题,Claude Code Security 使用多阶段验证系统,重新检查发现的漏洞并分配严重性和置信度评分。
Codex Security 采取略有不同的方法。它不完全依赖模型推理,而是在沙箱环境中验证疑似漏洞,然后再显示结果。OpenAI 表示,这一过程减少了噪声,并允许 AI 根据测试中收集的证据对发现进行排名。
“Codex Security 最初名为 Aardvark,去年在私有测试中推出,”OpenAI 在 X 上写道。公司补充:
“从那时起,我们显著改善了信号质量,减少了噪声,提高了严重性准确性,并降低了误报率,使发现更贴近实际风险。”
开发者在审查 Codex Security 结果时,可以查看支持数据、查看建议补丁的代码差异,并通过 Github 工作流集成修复方案。该系统还允许团队通过调整攻击面、仓库范围和风险容忍度等参数来自定义威胁模型。
虽然 Anthropic 的发布震动了部分网络安全行业,但 OpenAI 的进入迄今为止引发的讨论多于市场恐慌。当 Claude Code Security 于 2 月推出时,几家网络安全股短暂下跌 5% 至 10%,包括 Crowdstrike 和 Palo Alto Networks 等公司,但在随后的交易中大多恢复了涨势。
当时,分析师表示,抛售可能反映出对 AI 工具是否能取代应用安全市场部分份额的担忧。然而,许多研究人员认为,AI 工具更可能是补充现有安全平台,而非完全取代它们。
在过去两年中,AI 辅助漏洞检测迅速发展,大型语言模型(LLMs)越来越多地参与到网络安全研究任务中,如 Capture-the-Flag 比赛和自动漏洞发现。这些能力可以帮助防御者更快识别软件弱点,但也引发担忧,攻击者可能利用类似系统进行攻击。
为应对这些风险,OpenAI 于 2 月 5 日启动了“Cyber 可信访问”计划,为经过验证的安全研究人员提供受控访问先进模型进行防御研究。Anthropic 也通过与太平洋西北国家实验室等机构合作以及内部红队计划采取了类似措施。
AI 安全代理的出现标志着许多研究人员所称的“代理式网络安全”的转变,即自主系统持续分析、测试和修复软件漏洞。如果成功,这些工具可以缩短漏洞发现与补丁部署之间的时间——现代软件安全的最大弱点之一。
对于开发者和安全团队来说,这一时机难以忽视。AI 不再只是编写代码——它现在在审计、破解和修复代码,且常常在同一工作流程中完成。
随着 OpenAI 和 Anthropic 现在展开正面竞争,下一波网络安全工具可能不再是传统扫描器,而是永不眠、永不抱怨、理想情况下能在黑客之前发现漏洞的 AI 代理。