OpenAI 发布 GPT-5.5-Cyber:在 Anthropic 限制下开启 AI 安全竞赛新篇章
6月22日,OpenAI正式发布了其专业模型GPT-5.5-Cyber的完整版本,该模型专用于专业漏洞搜索、验证与修复。此举直接回应了针对Anthropic日益严格的监管限制,为OpenAI创造了独特的市场窗口。
该模型是Daybreak计划的核心组成部分,并非面向大众用户。只有经过验证的网络安全专家才能获得GPT-5.5-Cyber的访问权限,他们需要利用增强功能开展授权的防御性工作。
背景:Anthropic的限制如何开辟道路
6月9日,Anthropic推出了Claude模型的两个版本——Fable 5和Mythos 5。然而,在6月12日,根据美国政府出口管制指令,该公司被迫关闭了这些模型。这一决定引发了一系列问题:6月23日,Legion律师事务所对美国联邦政府提起诉讼,声称失去对Anthropic模型的访问权限破坏了其文档准备工具的正常运行。
在此背景下,OpenAI选择了更为务实的路径。该公司提前与美国联邦机构协调了审查程序,并仅向经过验证的用户开放GPT-5.5-Cyber的访问权限,从而将监管风险降至最低。
技术指标:GPT-5.5-Cyber的表现
据OpenAI称,新模型在专业基准测试中表现出色。在CyberGym测试中,GPT-5.5-Cyber得分85.6%,而标准版GPT-5.5为81.8%。在ExploitGym上,得分为39.5%对25.95%;在SEC-bench Pro上,得分为69.8%对63.1%。
然而,情况并非如此简单。英国人工智能安全研究所(AISI)进行了独立测试:GPT-5.5在10次尝试中有2次通过了32步企业攻击模拟The Last Ones,而Mythos Preview在10次尝试中有3次通过。在后续更新中,AISI显示,新版本的Mythos Preview在10次尝试中有6次完成了该场景,并首次完成了第二个场景Cooling Tower。
访问策略与合作伙伴关系
OpenAI明确表示,GPT-5.5-Cyber是面向特定用户的工具。对于大多数客户,仍推荐使用带有Trusted Access for Cyber和Codex Security的GPT-5.5。该公司还启动了Daybreak网络合作伙伴计划,参与者包括Akamai、Check Point、Cisco、CrowdStrike、IBM、Palo Alto Networks等巨头。
值得特别关注的是与Trail of Bits合作推出的开源项目计划Patch the Planet。首批参与者包括cURL、Go、Python、Sigstore和pyca/cryptography。自3月以来,Codex Security的云端版本已扫描了超过30000个代码库中的3000多万次提交,人工审核员标记了超过70000个已修复的发现。
我的专家评论:人工智能安全市场正进入新阶段——从展示能力转向实际应用。然而,测试指标与实际攻击场景之间的差距(如AISI数据所示)仍然显著。关键问题不在于谁在基准测试中得分更高,而在于谁的模型能够在真实企业基础设施环境中高效运行,同时将误报率降至最低。OpenAI押注于受控访问和合作伙伴关系,这看起来比Anthropic在缺乏充分监管准备的情况下发布"私有"模型的做法更为成熟。