人工智能市场分析:美元而非代币——衡量模型实力的关键指标
风投基金Dragonfly的管理合伙人哈西布·库雷希发表了一项重要声明,颠覆了人们对AI模型市场评估的传统认知。他认为,代币份额是一个极不可靠且扭曲现实的指标。比较模型必须完全依据其使用所花费的美元。基于OpenRouter平台上原始代币消耗的分析会导致系统性错误和错误结论。
库雷希指出了这种方法的四个关键问题。首先是大规模补贴。中国实验室经常以巨大折扣或完全免费的方式推出新模型。这吸引了用户在不同免费模型之间切换,人为地推高了代币消耗,但并未花费实际资金。
第二个问题是模型规模。像Qwen 3.5-27B这样的小型模型,每个代币的成本大约比旗舰级Claude Opus便宜一百倍。Qwen使用量的增长在图表上看起来像是开源模型份额的急剧上升,尽管从货币价值来看,这在经济上微不足道。他认为,分析应该在同一模型规模级别内进行。
第三个问题是多智能体系统。用同样的资金,可以运行基于DeepSeek或GLM 5.2的复杂多智能体架构,其“消耗”的代币数量是像Opus或GPT-5.5 Pro这样的单一先进模型的数倍。图表将显示Opus份额下降约18%,而实际支出仅转移了5%。库雷希强调:“这类图表夸大了低价代币的重要性。”
第四个问题在于OpenRouter平台本身。大型公司在选定一家领先实验室后,更倾向于直接联系Anthropic或OpenAI,绕过OpenRouter的加价。这在图表上表现为美国份额的下降,但实际上代币只是流向了平台之外。库雷希的结论是:OpenRouter有助于评估开源模型内部的份额,但不适用于比较开源与闭源模型。
SageRoad Research创始人特雷弗·诺伦也提出了类似观点,并将其与行业面临的价格压力联系起来。他引用了摩根大通的评估,认为未来代币的主要消耗将不是来自先进模型,而是来自足以完成特定任务的小型开源模型。
根据摩根大通的数据,亚马逊已提供约五百种开源模型,其价格仅为先进模型的一小部分。英伟达正与戴尔、联想和惠普合作,为AI智能体打造专用计算机。与此同时,像Claude Haiku和GPT-5.4-mini这样的自研小型模型,在目前由中国开发者——DeepSeek、MiniMax、小米和阿里巴巴——主导的“效率前沿”上仍缺乏竞争力。
成本对比尤为直观。在Claude Opus 4.8上运行一套Artificial Analysis Intelligence Index任务集,花费3700美元,得分为56分;而DeepSeek V4 Pro仅需186美元就能获得44分——成本相差约20倍。结论是:先进智能并非处处需要,只在必要时使用即可。Z.ai的GLM 5.2看起来与Anthropic和OpenAI的顶级模型不相上下。
诺伦认为,模型的商品化不仅来自领先实验室的竞争,也来自那些希望通过更便宜的专用模型来控制成本的公司。据他评估,企业支出仍是云巨头收回AI投资的最可行途径,但企业会尽可能少花钱。
专家观点:两种立场都指向同一结论:衡量人工智能市场应依据资金,而非代币。在价格压力下,优势正越来越多地转向廉价模型。这是一个根本性转变,投资者和分析师在评估该行业时必须加以考虑。那些继续盯着原始代币消耗的人,可能会错失市场的真实面貌。