OpenAI在Anthropic面临监管压力之际推出GPT-5.5-Cyber

24.06.2026

09:06

6月22日，OpenAI正式发布了其专用模型GPT-5.5-Cyber的完整版本，该模型专为搜索、验证和修复软件漏洞而设计。此次发布恰逢一个极具象征意义的时刻——就在美国政府实施出口限制，迫使Anthropic撤回其先进模型Claude Fable 5和Mythos 5之后。

GPT-5.5-Cyber是OpenAI全面网络安全计划Daybreak的关键组成部分，该计划还包括Codex Security工具以及与多家领先安全公司的合作伙伴关系。该模型不面向大众使用；只有经过验证的网络安全专家才能访问，以执行授权的防御操作。

战略机遇窗口

自6月9日Anthropic开放其Claude系列两个版本的访问权限后，AI安全领域的市场格局发生了根本性变化。到了6月12日，该公司便因美国政府根据出口管制的要求而被迫关闭这些模型。这引发了严重后果：6月23日，律师事务所Legion对美国提起诉讼，声称失去对Anthropic模型的访问权限破坏了其法律文件准备工具的正常运行。

OpenAI选择了截然不同的方法。该公司提前与美国联邦机构协调了所有检查，并仅向经过验证的用户开放GPT-5.5-Cyper。这使其得以规避监管风险，并占据了腾出的市场空间。

技术规格与基准测试

据OpenAI称，GPT-5.5-Cyber在专项测试中表现出色。在CyberGym基准测试中，该模型得分85.6%，而标准版GPT-5.5为81.8%。在ExploitGym上差距更为显著：39.5%对比25.95%。在SEC-bench Pro测试中，结果分别为69.8%和63.1%。

然而，理解这些数字的背景至关重要。CyberGym侧重于在受控环境中复现已知漏洞，这并未涵盖真实攻击的全部范围。此外，根据英国AI安全研究所的数据，在复杂的多步骤场景中（例如模拟企业攻击的The Last Ones测试），GPT-5.5-Cyber在10次尝试中通过了2次，而Anthropic更新版的Mythos Preview则在10次尝试中通过了6次。

与竞争对手的比较

与已撤回的Anthropic Mythos 5模型直接比较显示，GPT-5.5-Cyber在CyberGym上以85.6%对83.8%的成绩胜出。然而，在更复杂的测试（如The Last Ones）中，情况则不那么明朗。这表明，尽管OpenAI的专用模型在漏洞复现等狭窄任务上表现强劲，但在复杂的真实攻击场景中，Anthropic仍保持优势。

生态系统与访问限制

OpenAI还启动了Daybreak网络安全合作伙伴计划，参与者包括Akamai、Check Point、Cisco、CrowdStrike、IBM、Palo Alto Networks等行业巨头。此外，该公司还宣布了面向开源项目的Patch the Planet计划，该计划与Trail of Bits合作创建，并有HackerOne参与。首批参与者包括cURL、Go、Python和pyca/cryptography。

我对局势的分析表明，OpenAI在战略上精准地选择了发布时机，填补了Anthropic退出后留下的真空。然而，网络安全领域的AI军备竞赛才刚刚开始。尽管GPT-5.5-Cyber在狭窄的基准测试中展现出优势，但真实的攻击场景仍由Anthropic主导。问题在于，OpenAI能否在监管限制再次改变游戏规则之前，在复杂任务上赶上竞争对手。

加密新闻