加密新闻

26.06.2026
17:00

代币幻觉:为何人工智能市场应以美元而非消费单位来评估

近期人工智能行业出现了一个危险趋势:分析师和记者越来越依赖代币消耗的原始数据来评估模型的市场份额。作为一名专业分析师,我认为这种方法从根本上就是错误的,且具有误导性。Dragonfly 管理合伙人哈西布·库雷希最近有力地论证了为何代币份额是一个糟糕的指标,并提出了按实际资金支出来衡量市场的建议。让我们来剖析他的逻辑。

代币统计的四大"陷阱"

第一个也是最明显的问题就是补贴。中国实验室经常以巨大折扣甚至免费访问的方式推出新模型。这吸引了大量用户在不同免费模型之间跳转,人为地推高了代币消耗量,却没有带来一分钱的实际收入。这类使用量图表描绘出漂亮的增长曲线,却与经济现实毫无关联。

第二个问题与模型规模有关。像 Qwen 3.5-27B 这样的小型模型,每个代币的成本大约是旗舰级 Claude Opus 的百分之一。Qwen 使用量的增长在图表上可能表现为开源模型份额的急剧上升,但从经济角度看,这完全是微不足道的量级。分析市场时不按模型重量级进行分类,无异于拿大象和蚂蚁做比较。

第三个问题是多智能体系统。你可以花费相同的金额,用于基于 DeepSeek 或 GLM 5.2 的复杂多智能体架构,也可以用于像 Opus 或 GPT-5.5 Pro 这样的单一前沿模型。但在性能相当的情况下,多智能体配置会为同样的花费消耗多得多的代币。正如库雷希精准指出的那样,如果 Opus 5% 的使用量转移到这样一个代币消耗量增加四倍的系统中,图表将显示 Opus 份额下降 18%,而实际支出仅减少了 5%。这是对真实情况的严重扭曲。

第四个问题是 OpenRouter 平台本身的局限性。如果一家公司已经选定了一家前沿实验室,那么直接与 Anthropic 或 OpenAI 对接,比通过加价的 OpenRouter 更划算。这在图表上会表现为美国份额的下降,而实际上代币只是流向了平台之外。OpenRouter 对于评估开源模型内部的份额是有用的,但绝对不适合用来比较开源模型和闭源模型。

未来属于廉价模型?

SageRoad Research 创始人特雷弗·诺伦也提出了类似观点,并将其与行业面临的价格压力联系起来。他引用了摩根大通的评估:未来许多代币可能并非由前沿模型消耗,而是由足以胜任特定任务的小型开源模型消耗。亚马逊已经提供了大约五十种开源模型,其价格仅为前沿模型成本的一小部分。英伟达正与戴尔、联想和惠普合作,打造面向 AI 智能体的计算机。

成本方面的例子尤其具有说服力。根据摩根大通的数据,在 Claude Opus 4.8 上运行一套 Artificial Analysis Intelligence Index 任务集,成本为 3700 美元,得分为 56 分;而 DeepSeek V4 Pro 仅需 186 美元就能获得 44 分——成本大约是前者的二十分之一。结论显而易见:前沿水平的智能并非所有场景都需要,只有在确实必要的地方才用得上。来自 Z.ai 的 GLM 5.2 看起来与 Anthropic 和 OpenAI 的顶级模型不相上下。

诺伦认为,模型的商品化不仅来自前沿实验室之间的竞争,也来自那些希望通过更便宜的专用模型来控制成本的公司。

作为分析师,我的结论是:两种观点都指向同一个方向——人工智能市场应该用金钱来衡量,而不是代币。在价格压力下,优势正越来越多地向廉价模型转移。这是一个根本性的转变,投资者和开发者现在就应该加以考虑。那些继续盯着代币消耗原始图表的人,可能会错过行业资本重新配置的真实图景。