加密新闻

27.06.2026
10:33

OpenAI开放GPT-5.6预览版:三种模型、三个能力层级及增强的安全措施

OpenAI 在其语言模型发展上迈出了重要一步,推出了由三个专业版本组成的 GPT-5.6 系列:Sol、Terra 和 Luna。目前,仅限有限的可信合作伙伴通过 API 和 Codex 访问,此次发布已与美国政府协调,后者要求以预览形式进行初步阶段。

功能系列:从旗舰到经济型解决方案

旗舰模型 Sol 定位为公司历史上最强大的版本。它配备了 max 推理模式,可分配更多时间深入处理复杂任务,以及 ultra 模式,利用子代理加速复杂操作。Terra 则被描述为日常任务的“主力军”。据 OpenAI 估计,其性能与 GPT-5.5 相当,但成本仅为一半。Luna 是最快且最经济的选择,适用于大规模使用。

性能记录与网络安全

Sol 已在命令行任务基准测试 Terminal-Bench 2.1 中创下新纪录。在 GeneBench v1 上,该模型在消耗更少 token 的情况下,表现优于 GPT-5.5。在 ExploitBench 测试中,Sol 与 Mythos Preview 具有竞争力,同时仅使用约三分之一的输出 token。值得注意的是,随着推理深度的增加,所有三个模型在 ExploitGym 上的结果均有所改善。

在安全方面,OpenAI 声称 GPT-5.6 系列配备了最强的防护堆栈。Sol 在 Preparedness Framework 中未超过 Cyber Critical 阈值。在 Chromium 和 Firefox 测试中,该模型成功发现了漏洞,但无法自主创建完整可用的漏洞利用程序。为验证防护能力,已投入超过 700,000 GPU 小时(以 A100 等效计算)用于自动化红队测试。

定价与未来计划

每百万 token 的成本为:Sol 输入 5 美元,输出 30 美元;Terra 输入 2.50 美元,输出 15 美元;Luna 输入 1 美元,输出 6 美元。OpenAI 计划于 7 月在 Cerebras 平台上推出 Sol,速度可达每秒 750 token,但此阶段的访问仍将受限。

作为分析师,我的评论: 将产品明确划分为三个层级——Sol、Terra、Luna——是一项明智的战略举措,使 OpenAI 能够覆盖从爱好者和研究人员到大型企业的不同市场细分。然而,发布过程受美国政府监管这一事实,凸显了监管机构对强大 AI 模型安全性的日益关注。未来几周,我们将看到社区如何接受这些新产品,但显而易见的是,OpenAI 正押注于受控而非大规模部署。