NVIDIA免费提供强大的AI——并借此赚得比竞争对手更多

21.06.2026

10:16

2026年6月4日，英伟达发布了Nemotron 3 Ultra——Nemotron 3系列中最大的开源AI模型。该公司以自由许可协议公开了模型权重、训练数据及训练方法。该模型专为长期运行的自主智能体及复杂推理任务而设计。

与ChatGPT或Claude等闭源旗舰模型不同，Nemotron 3 Ultra可下载、可在自有数据上微调，并能在自有基础设施上运行。其核心优势不在于追求极致智能，而在于开放性、高效性以及对模型的控制权。

模型架构的独特之处

Nemotron 3 Ultra并非简单的"放大版Transformer"。其基础是混合架构，融合了三种不同方法：Mamba-2层、注意力层以及潜在专家混合机制——该机制能将每个请求仅导向模型内部所需的"专家"模块。

Mamba-2层可快速且经济地处理长文本：其计算成本随文本长度线性增长，而非像传统注意力机制那样呈指数级增长。注意力层则能精准记忆大量文本信息。而潜在专家混合机制在将数据传递给专家前会进行压缩，使每位专家都能精准高效地工作，无需额外计算。

该模型总计约5500亿参数，但处理每个令牌时仅激活约550亿参数。这使得它既能像庞大系统一样思考，又能保持紧凑型模型的成本效率。结合100万令牌的上下文窗口和每秒超过300令牌的处理速度，其吞吐量提升五到六倍，任务成本降低约30%。

英伟达的战略与生态布局

行业分析师认为，此次发布的核心价值不在于模型本身，而在于英伟达围绕其硬件构建的生态系统。逻辑很简单：运行Nemotron的用户几乎必然使用英伟达显卡，通过其软件工具进行微调，并部署在其软件平台上。开放性并非慈善行为，而是引导开发者回归购买公司硬件的手段。

英伟达之所以能如此布局，是因为其财务实力远超模型研发成本。凭借超过5万亿美元的市值，Nemotron 3 Ultra数亿美元的研发投入对公司而言几乎微不足道。显卡销售足以覆盖研究成本，因此英伟达能够免费提供模型，同时赚取比闭源竞争对手收费模式更多的利润。

政治背景也为此次发布增添了分量。这款开源美国模型可被审查、修改并在自有服务器上运行——这使其对从欧洲到东南亚等致力于构建独立国家AI系统的国家极具吸引力。此类模型无法被远程关闭，在近期闭源模型受限的背景下尤显珍贵。

模型的不足与未来展望

尽管优势显著，Nemotron 3 Ultra并非市场上最智能的模型。在独立评测机构Artificial Analysis Intelligence Index中，它获得48分——这是美国开源模型的最佳成绩，但全球范围内仍落后于Kimi K2.6（54分）和DeepSeek等领先者。分析师估计，开源模型与闭源模型存在三到七个月的差距。

但在我看来，这种差距正变得愈发无关紧要——只要开源模型足以应对实际任务。一家在自有服务器上部署Nemotron 3 Ultra处理信贷业务的银行，并不需要旗舰级的智能水平，而是需要能在封闭数据上微调、在安全环境中运行、且不泄露机密信息的模型。

英伟达押注效率而非测试成绩的策略，或许更具远见。在AI大规模部署中，模型运行成本将成为关键因素：那些智能水平几乎不逊色、但成本低五倍的模型，将在实际应用中胜出。分析师预计，开源生态系统将持续壮大：英伟达拥有资源、动力和分发渠道，能够比任何其他公司更快地发布更强大的开源模型。

专家观点：未来12至18个月内，我们将看到基于Nemotron架构的开源模型成为企业级标准，而闭源系统将退居为仅需顶级1%质量的特定场景的利基产品。英伟达通过免费提供AI，实际上切断了试图通过模型访问收费的竞争对手的生存空间。这是典型的"剃刀与刀片"策略，只不过规模扩展到了整个行业。

加密新闻