OpenAI 推出 GPT-5.5-Cyber:在 Anthropic 限制下的网络安全新时代
6月22日,OpenAI 正式发布了 GPT-5.5-Cyber 的完整版本——这是一款专为搜索、验证和修复漏洞而设计的专用模型。此举正值 Anthropic 受到严格限制之际,为 OpenAI 创造了一个独特的市场窗口。
背景:OpenAI 如何抓住时机
6月9日,Anthropic 推出了 Claude 系列的两个版本:Fable 5 和 Mythos 5。后者被定位为“私有”基础模型,限制较为宽松。然而,6月12日,在美国政府根据出口管制指令采取行动后,Anthropic 被迫关闭了这些模型。这引发了广泛不满:6月23日,Legion 公司向美国政府提起诉讼,声称失去对 Anthropic 模型的访问权限,破坏了其法律文件准备工具的正常运行。
与 Anthropic 不同,OpenAI 选择了更为谨慎的道路。该公司事先与美国联邦机构协调了所有审查,并将 GPT-5.5-Cyber 仅向经过验证的网络安全专家开放。这种方法使其避免了监管风险,并占据了腾出的市场空间。
技术特性:新模型的能力
据 OpenAI 称,GPT-5.5-Cyber 在专业基准测试中表现出色。在 CyberGym 测试中,该模型得分为 85.6%,而标准版 GPT-5.5 为 81.8%。这一基准测试由加州大学伯克利分校的研究人员开发,包含基于 188 个开源项目中真实漏洞的 1507 个任务。在 ExploitGym 上,该模型得分为 39.5%,而普通版本为 25.95%;在 SEC-bench Pro 上,得分为 69.8%,而普通版本为 63.1%。
与竞争对手的比较尤其值得关注。GPT-5.5-Cyber 在 CyberGym 上超越了 Anthropic Mythos 5:85.6% 对 83.8%。然而,在更复杂的场景中,情况则不那么明朗。英国人工智能安全研究所(AISI)报告称,在 32 步的企业攻击模拟“The Last Ones”中,GPT-5.5-Cyber 在 10 次尝试中成功完成了 2 次,而 Mythos Preview 在 10 次中完成了 3 次。随后,AISI 更新了数据:新版本的 Mythos Preview 在 10 次尝试中通过了 6 次,而 GPT-5.5-Cyber 仅通过了 3 次。
访问策略与合作伙伴关系
OpenAI 明确表示,GPT-5.5-Cyber 并非面向大众用户。该模型仅对需要增强功能以进行授权防御工作的经过验证的专家开放。对于普通客户,该公司推荐使用带有 Trusted Access for Cyber 和 Codex Security 的标准版 GPT-5.5。
在 Daybreak 计划框架内,OpenAI 启动了网络合作伙伴计划,参与者包括 Akamai、Check Point、Cisco、CrowdStrike、IBM、Palo Alto Networks、Proofpoint、SentinelOne、Wiz 和 Zscaler 等巨头。此外,还与 Trail of Bits 合作,在 HackerOne 的参与下,启动了面向开源项目的“Patch the Planet”倡议。首批参与者包括 cURL、Go、Python、Sigstore 和 pyca/cryptography。
我的专家观点: GPT-5.5-Cyber 的发布不仅是技术突破,更是在人工智能监管日益严格背景下的战略举措。OpenAI 展示了如何在创新与合规之间取得有效平衡,而竞争对手则面临监管限制。然而,在复杂攻击场景(如 The Last Ones)中的性能差距表明,网络能力的竞赛远未结束。未来几个月,我们将看到这种动态如何影响整个网络安全市场。