OpenAI推出GPT-5.5-Cyber:在Anthropic面临监管压力之际开启网络安全新时代

6月22日,OpenAI 正式发布了其最新模型的完整版本——GPT-5.5-Cyber。这不仅仅是语言模型的又一次更新,而是一个专门用于搜索、验证和修复软件漏洞的专业工具。此次发布正值行业极度紧张的时刻——就在美国政府实施出口限制,迫使 Anthropic 撤回其先进模型 Fable 5 和 Mythos 5 之后。
OpenAI 的机会窗口
围绕 Anthropic 的局势为 OpenAI 创造了一个独特的“窗口”。6月9日,Anthropic 发布了 Claude Mythos 5——一款为专业用途设计、限制有所放宽的模型。然而,在6月12日,迫于美国政府根据出口管制指令施加的压力,该公司不得不关闭对这些模型的访问权限。这引发了一波不满情绪,其中包括总部位于加拿大的律师事务所 Legion 提起的诉讼,其开发团队也位于加拿大。
相反,OpenAI 选择了与监管机构进行预防性合作的道路。该公司强调,模型的所有测试均已事先与美国联邦机构达成一致,并且 GPT-5.5-Cyber 的访问权限仅提供给经过验证的网络安全专家。这使得 OpenAI 得以规避监管风险,并占据了腾出的市场空间。
技术规格与基准测试
GPT-5.5-Cyber 在专业测试中展现了令人瞩目的成绩。在 CyberGym 基准测试中,该模型取得了85.6%的成绩,显著高于标准版 GPT-5.5 的81.8%。更具说服力的是 ExploitGym 测试,该测试评估将漏洞转化为可用利用程序的能力:新模型在此项测试中的成绩为39.5%,而普通版本为25.95%。在长期漏洞搜索测试 SEC-bench Pro 中,该模型得分为69.8%,而普通版本为63.1%。
然而,根据英国人工智能安全研究所(AISI)的数据,情况并非一边倒。在名为“The Last Ones”的复杂企业攻击模拟中,GPT-5.5-Cyber 在10次尝试中成功了2次,而被撤回的 Anthropic Mythos Preview 则在10次中成功了3次。此外,在更新后,Mythos Preview 的成绩达到了10次中成功6次,而 GPT-5.5 为10次中成功3次。这表明,尽管 OpenAI 的专业模型优于其基础版本,但人工智能安全领域的军备竞赛远未结束。
生态系统与访问限制
GPT-5.5-Cyber 只是更广泛的 Daybreak 计划的一部分。OpenAI 还启动了一项合作伙伴计划,参与者包括 Akamai、Cisco、CrowdStrike 和 IBM 等行业巨头,以及针对开源项目(如 cURL、Go、Python)的 Patch the Planet 计划。据该公司称,自3月份以来,Codex Security 云服务已扫描超过3000万次提交,发现了超过70,000个已修复的漏洞。
该模型并非面向大众使用。OpenAI 明确表示,这是为在授权场景下工作的特定专业人士提供的工具。对于普通客户,仍建议使用配备 Trusted Access for Cyber 的标准版 GPT-5.5。
专家观点。 在 Anthropic 受限之际推出 GPT-5.5-Cyber,是 OpenAI 的一步妙棋,展示了其对监管动态的理解。然而,AISI 的数据表明,在自主攻击领域,Anthropic 的模型可能仍然领先。当前的关键问题不在于谁能更快地发现漏洞,而在于谁能更有效、更安全地将这些能力集成到真实的企业系统中,同时不创造新的风险。网络安全市场正进入一个时代,人工智能代理既是主要武器,也是主要盾牌。