美元,而非代币:为何AI模型市场份额是一种危险的幻觉
Dragonfly 管理合伙人哈西布·库雷希对当前 AI 模型市场评估方法提出尖锐批评。他认为,基于代币消耗的分析——尤其是在 OpenRouter 平台上——会导致根本性错误结论。真正的衡量标准应是用户花费的美元金额,而非原始代币数量。
库雷希指出,问题根源在于几个关键偏差。首先是补贴因素。中国实验室经常推出具有激进折扣甚至完全免费访问的模型。这吸引了大量用户在免费模型间切换,虚增代币统计数据,却未带来实际收入。第二个因素是模型大小导致的代币成本巨大差异。像 Qwen 3.5-27B 这样的小型模型,每代币成本可能比旗舰级 Claude Opus 便宜百倍。Qwen 在 OpenRouter 图表上的份额激增看似惊人,但从经济角度看可能微不足道。库雷希强调,正确的分析只能在同类权重模型中进行。
代币吞噬系统与 OpenRouter 的"盲目"统计
第三个陷阱是多智能体系统。用户可能花费相同金额,用于基于 DeepSeek 或 GLM 5.2 的复杂架构,或用于向 Opus 等顶级模型发送一次查询。在性能相当的情况下,多智能体配置消耗的代币数量可能是后者的数倍。"如果 Opus 5% 的使用量转移到这种代币消耗量四倍的系统,图表将显示 Opus 份额损失 18%,而实际支出仅转移 5%,"库雷希解释道。这戏剧性地夸大了廉价代币的重要性。
第四个细节是选择 OpenRouter 作为数据源本身的问题。如果企业已确定供应商(Anthropic 或 OpenAI),直接合作更有利,可避免平台加价。在 OpenRouter 图表上,这表现为美国模型份额下降,而实际消费只是转移到了平台之外。库雷希的结论毫不妥协:OpenRouter 仅适用于开放模型细分市场内的比较,完全不适合开放与封闭生态系统的对比。
价格压力:廉价模型的未来?
SageRoad Research 创始人特雷弗·诺伦进一步阐述了这一逻辑。他引用摩根大通数据:未来许多代币将由小型开放模型消耗,而非前沿模型,这些模型足以满足特定任务需求。亚马逊已提供约五百种开放模型,价格仅为旗舰模型的零头;英伟达与戴尔、联想、惠普合作打造 AI 智能体专用计算机。与此同时,美国巨头的自有迷你模型(Claude Haiku、GPT-5.4-mini)在"效率边界"上仍缺乏竞争力,该领域目前由 DeepSeek、MiniMax、小米和阿里巴巴等中国开发者主导。
成本对比尤为显著。在 Claude Opus 4.8 上运行 Artificial Analysis Intelligence Index 任务集需花费 3,700 美元,得分为 56 分。DeepSeek V4 Pro 仅需 186 美元即可获得 44 分——成本约为前者的二十分之一。结论显而易见:前沿智能并非适用于所有场景,而在需要之处,Z.ai 的 GLM 5.2 已能与 Anthropic 和 OpenAI 的顶级模型相媲美。
专家观点:库雷希和诺伦的论点并非单纯的学术争论。对于常将"链上"指标视为绝对真理的加密行业而言,这是一记重要提醒:缺乏变现背景的原始数据可能产生误导。AI 市场正走向商品化,真正的竞争将围绕企业预算的美元展开,而非代币数量。中国模型在"性价比"领域的胜利不仅是趋势,更是长期结构性转变。