加密新闻

24.06.2026
09:06

OpenAI在Anthropic面临监管压力之际推出GPT-5.5-Cyber

OpenAI的ChatGPT聊天机器人

6月22日,OpenAI正式发布了其专用模型GPT-5.5-Cyber的完整版本,该模型专为搜索、验证和修复软件漏洞而设计。此次发布恰逢一个极具象征意义的时刻——就在美国政府实施出口限制,迫使Anthropic撤回其先进模型Claude Fable 5和Mythos 5之后。

GPT-5.5-Cyber是OpenAI全面网络安全计划Daybreak的关键组成部分,该计划还包括Codex Security工具以及与多家领先安全公司的合作伙伴关系。该模型不面向大众使用;只有经过验证的网络安全专家才能访问,以执行授权的防御操作。

战略机遇窗口

自6月9日Anthropic开放其Claude系列两个版本的访问权限后,AI安全领域的市场格局发生了根本性变化。到了6月12日,该公司便因美国政府根据出口管制的要求而被迫关闭这些模型。这引发了严重后果:6月23日,律师事务所Legion对美国提起诉讼,声称失去对Anthropic模型的访问权限破坏了其法律文件准备工具的正常运行。

OpenAI选择了截然不同的方法。该公司提前与美国联邦机构协调了所有检查,并仅向经过验证的用户开放GPT-5.5-Cyper。这使其得以规避监管风险,并占据了腾出的市场空间。

技术规格与基准测试

据OpenAI称,GPT-5.5-Cyber在专项测试中表现出色。在CyberGym基准测试中,该模型得分85.6%,而标准版GPT-5.5为81.8%。在ExploitGym上差距更为显著:39.5%对比25.95%。在SEC-bench Pro测试中,结果分别为69.8%和63.1%。

然而,理解这些数字的背景至关重要。CyberGym侧重于在受控环境中复现已知漏洞,这并未涵盖真实攻击的全部范围。此外,根据英国AI安全研究所的数据,在复杂的多步骤场景中(例如模拟企业攻击的The Last Ones测试),GPT-5.5-Cyber在10次尝试中通过了2次,而Anthropic更新版的Mythos Preview则在10次尝试中通过了6次。

与竞争对手的比较

与已撤回的Anthropic Mythos 5模型直接比较显示,GPT-5.5-Cyber在CyberGym上以85.6%对83.8%的成绩胜出。然而,在更复杂的测试(如The Last Ones)中,情况则不那么明朗。这表明,尽管OpenAI的专用模型在漏洞复现等狭窄任务上表现强劲,但在复杂的真实攻击场景中,Anthropic仍保持优势。

生态系统与访问限制

OpenAI还启动了Daybreak网络安全合作伙伴计划,参与者包括Akamai、Check Point、Cisco、CrowdStrike、IBM、Palo Alto Networks等行业巨头。此外,该公司还宣布了面向开源项目的Patch the Planet计划,该计划与Trail of Bits合作创建,并有HackerOne参与。首批参与者包括cURL、Go、Python和pyca/cryptography。

我对局势的分析表明,OpenAI在战略上精准地选择了发布时机,填补了Anthropic退出后留下的真空。然而,网络安全领域的AI军备竞赛才刚刚开始。尽管GPT-5.5-Cyber在狭窄的基准测试中展现出优势,但真实的攻击场景仍由Anthropic主导。问题在于,OpenAI能否在监管限制再次改变游戏规则之前,在复杂任务上赶上竞争对手。