人工智能市场:为何“代币”指标具有误导性,而应以美元计算
最近,人工智能行业流行通过代币消耗量来比较模型。然而,正如顶尖分析师们的最新讨论所示,这种方法从根本上就是错误的。风投公司Dragonfly的管理合伙人哈西布·库雷希正确地指出,代币份额是评估AI模型市场的一个极不可靠的指标。只有实际花费的美元,而非原始消耗量,才能真实反映市场实力和需求。
为什么代币指标会如此扭曲现实?库雷希指出了几个关键问题。首先是补贴。中国实验室经常推出带有激进折扣甚至免费访问的新模型。这人为地推高了代币消耗量,因为用户在不花一分钱的情况下,从一个免费模型迁移到另一个。图表显示增长迅猛,但背后并无真正的货币化支撑。
规模重要:每代币价格
第二个问题在于模型的不同规模。像Qwen 3.5-27B这样的小型模型,每代币价格可能比Claude Opus等旗舰解决方案便宜一百倍。OpenRouter图表上Qwen消耗份额的突然飙升,看起来像是开源模型的胜利,但在经济意义上却微不足道。我深信,正确的分析只能在同类规模中进行——必须按大小在同一类别内比较模型。
第三个问题是多智能体系统。你可以用同样的金额,在基于DeepSeek或GLM 5.2的复杂配置上,或者向前沿模型Opus发出一次查询。然而,多智能体架构会在相同成本下消耗数倍于前的代币。库雷希举了一个直观的例子:如果5%的Opus使用量迁移到这样一个代币消耗量增加四倍的系统中,图表将显示Opus份额下降18%,而实际支出仅转移了5%。这是代币指标如何夸大廉价代币价值的经典案例。
OpenRouter:扭曲的市场镜像
第四个问题与OpenRouter平台本身的选择有关。大型公司在确定一家前沿实验室后,更倾向于直接与Anthropic或OpenAI合作,避开OpenRouter的加价。这在图表上表现为美国份额下降,而实际上代币只是流向了平台之外。结论显而易见:OpenRouter有助于评估开源模型内部的份额,但完全不适合比较开源和闭源系统。
SageRoad Research的创始人特雷弗·诺伦也发展了这一观点,并将其与行业面临的价格压力联系起来。摩根大通的数据显示,未来许多代币将不是由前沿模型消耗,而是由足以完成特定任务的小型开源模型消耗。亚马逊已经提供了大约五十种开源模型,其价格仅为前沿模型成本的一小部分。
摩根大通的数据尤其说明问题:在Claude Opus 4.8上运行Artificial Analysis Intelligence Index任务集,成本为3700美元,得分为56分;而DeepSeek V4 Pro仅需186美元就能获得44分——价格便宜约20倍。据该银行称,Claude Haiku和GPT-5.4-mini等自家小型模型在“效率前沿”上目前缺乏竞争力,而这一领域正由DeepSeek、MiniMax、小米和阿里巴巴等中国开发者主导。
作为专家的分析:我们正在目睹一场结构性转变。模型的商品化不可避免,这不仅来自前沿实验室的竞争,也来自寻求通过更便宜的专用解决方案来控制成本的企业。两种观点都归结于一点:衡量AI市场应以金钱为准,而非代币。在价格压力下,优势正越来越多地转向廉价模型,关注加密货币和AI领域的投资者应重新审视其关键绩效指标。传统的代币消耗指标已经过时——未来属于美元效率。