加密新闻

21.06.2026
10:16

NVIDIA免费提供强大的AI——并借此赚得比竞争对手更多

2026年6月4日,英伟达发布了Nemotron 3 Ultra——Nemotron 3系列中最大的开源AI模型。该公司以自由许可协议公开了模型权重、训练数据及训练方法。该模型专为长期运行的自主智能体及复杂推理任务而设计。

与ChatGPT或Claude等闭源旗舰模型不同,Nemotron 3 Ultra可下载、可在自有数据上微调,并能在自有基础设施上运行。其核心优势不在于追求极致智能,而在于开放性、高效性以及对模型的控制权。

模型架构的独特之处

Nemotron 3 Ultra并非简单的"放大版Transformer"。其基础是混合架构,融合了三种不同方法:Mamba-2层、注意力层以及潜在专家混合机制——该机制能将每个请求仅导向模型内部所需的"专家"模块。

Mamba-2层可快速且经济地处理长文本:其计算成本随文本长度线性增长,而非像传统注意力机制那样呈指数级增长。注意力层则能精准记忆大量文本信息。而潜在专家混合机制在将数据传递给专家前会进行压缩,使每位专家都能精准高效地工作,无需额外计算。

该模型总计约5500亿参数,但处理每个令牌时仅激活约550亿参数。这使得它既能像庞大系统一样思考,又能保持紧凑型模型的成本效率。结合100万令牌的上下文窗口和每秒超过300令牌的处理速度,其吞吐量提升五到六倍,任务成本降低约30%。

英伟达的战略与生态布局

行业分析师认为,此次发布的核心价值不在于模型本身,而在于英伟达围绕其硬件构建的生态系统。逻辑很简单:运行Nemotron的用户几乎必然使用英伟达显卡,通过其软件工具进行微调,并部署在其软件平台上。开放性并非慈善行为,而是引导开发者回归购买公司硬件的手段。

英伟达之所以能如此布局,是因为其财务实力远超模型研发成本。凭借超过5万亿美元的市值,Nemotron 3 Ultra数亿美元的研发投入对公司而言几乎微不足道。显卡销售足以覆盖研究成本,因此英伟达能够免费提供模型,同时赚取比闭源竞争对手收费模式更多的利润。

政治背景也为此次发布增添了分量。这款开源美国模型可被审查、修改并在自有服务器上运行——这使其对从欧洲到东南亚等致力于构建独立国家AI系统的国家极具吸引力。此类模型无法被远程关闭,在近期闭源模型受限的背景下尤显珍贵。

模型的不足与未来展望

尽管优势显著,Nemotron 3 Ultra并非市场上最智能的模型。在独立评测机构Artificial Analysis Intelligence Index中,它获得48分——这是美国开源模型的最佳成绩,但全球范围内仍落后于Kimi K2.6(54分)和DeepSeek等领先者。分析师估计,开源模型与闭源模型存在三到七个月的差距。

但在我看来,这种差距正变得愈发无关紧要——只要开源模型足以应对实际任务。一家在自有服务器上部署Nemotron 3 Ultra处理信贷业务的银行,并不需要旗舰级的智能水平,而是需要能在封闭数据上微调、在安全环境中运行、且不泄露机密信息的模型。

英伟达押注效率而非测试成绩的策略,或许更具远见。在AI大规模部署中,模型运行成本将成为关键因素:那些智能水平几乎不逊色、但成本低五倍的模型,将在实际应用中胜出。分析师预计,开源生态系统将持续壮大:英伟达拥有资源、动力和分发渠道,能够比任何其他公司更快地发布更强大的开源模型。

专家观点:未来12至18个月内,我们将看到基于Nemotron架构的开源模型成为企业级标准,而闭源系统将退居为仅需顶级1%质量的特定场景的利基产品。英伟达通过免费提供AI,实际上切断了试图通过模型访问收费的竞争对手的生存空间。这是典型的"剃刀与刀片"策略,只不过规模扩展到了整个行业。