加密新闻

27.06.2026
09:16

OpenAI推出旗舰系列GPT-5.6:Sol、Terra和Luna——AI模型的全新视角

OpenAI 在其技术发展上迈出了重要一步,发布了 GPT-5.6 系列模型,包括三个版本:旗舰版 Sol、通用版 Terra 和预算版 Luna。目前,通过 API 和 Codex 的访问权限仅向有限的可信合作伙伴开放。该公司强调,此次发布已与美国政府协调,后者要求以受限预览的形式进行安全评估。

关键特性与定位

Sol 被定位为 OpenAI 历史上最强大的模型。它配备两种创新模式:max 模式用于深度分析需要长时间推理的复杂任务,ultra 模式则利用子代理加速多步骤流程的执行。据开发者称,Terra 的性能与 GPT-5.5 相当,但成本仅为后者的一半。Luna 是最快速且最经济的选择,专注于日常任务。

基准测试与性能

测试结果令人印象深刻。Sol 在命令行基准测试 Terminal-Bench 2.1 中创下新纪录。在 GeneBench v1 上,该模型在消耗更少令牌的情况下取得了优于 GPT-5.5 的结果。在 ExploitBench 的网络安全任务中,Sol 与 Mythos Preview 具有竞争力,同时仅使用约三分之一的输出令牌。所有三款模型在 ExploitGym 的网络安全任务中,随着推理深度的增加,性能均有所提升。

安全与控制

OpenAI 声明,GPT-5.6 Sol 在其 Preparedness Framework 中未超过 Cyber Critical 阈值。测试表明,该模型能够发现浏览器(Chromium、Firefox)中的漏洞和利用原语,但无法自主创建完整的可用漏洞利用程序。为验证防护措施,已投入超过 700,000 GPU 小时(以 A100 等效计算)用于自动化红队测试。预览阶段引入了多层次措施,包括实时监控和账户级别限制。

模型定价如下:Sol 为每百万输入令牌 5 美元,输出令牌 30 美元;Terra 为 2.50 美元和 15 美元;Luna 为 1 美元和 6 美元。OpenAI 计划于 7 月在 Cerebras 平台上推出 Sol,速度可达每秒 750 令牌,但此阶段的访问仍将受限。

专家观点: GPT-5.6 的发布不仅是更新,更是对市场的战略性重新思考。将产品分为三个明确细分的模型(旗舰版、主力版和预算版),是对 DeepSeek 等竞争对手日益激烈竞争的直接回应。尤其值得关注的是对网络安全的重视以及与政府的合作。这向市场传递了一个信号:OpenAI 已准备好迎接更严格的监管,同时希望通过提供适用于各种任务和预算的工具,保持创新领先地位。