衡量AI市场应以美元为单位,而非代币:Dragonfly分析师观点
风投公司Dragonfly的管理合伙人哈西布·库雷希对当前AI模型市场评估的普遍方法提出了尖锐批评。他认为,依赖原始代币消耗量是一种根本性的错误方法,会导致市场图景失真。唯一合理的衡量标准是实际现金流,即用户实际花费的美元。
为何代币是不可靠的指标
库雷希指出了四个关键问题,使得"代币份额"这一指标在模型比较中几乎毫无用处。
第一个问题是补贴。中国实验室经常推出带有激进折扣甚至完全免费访问的新模型。这人为地推高了代币消耗量:用户从一种免费模型迁移到另一种,制造出高需求的假象,而实际资金支出为零。
第二个问题是模型规模不同。像Qwen 3.5-27B这样的小型模型,每个代币的成本大约只有Claude Opus等旗舰模型的百分之一。Qwen使用量的增长在图表上可能看起来像是开源模型份额的急剧上升,但从经济角度看,这完全是微不足道的。库雷希表示,分析市场必须严格按模型规模的"重量级"类别进行。
第三个问题是多智能体系统。你可以花费相同金额,用于基于DeepSeek或GLM 5.2的复杂架构,也可以用于向Opus或GPT-5.5 Pro等前沿模型发起一次查询,且性能相当。然而,多智能体配置在相同成本下会"燃烧"多得多的代币。库雷希举了一个直观的例子:如果Opus 5%的使用量迁移到这样一个代币消耗量四倍的系统中,图表将显示Opus份额损失约18%,而实际支出仅转移了5%。"这类图表夸大了低价值代币的重要性,"专家总结道。
第四个问题是OpenRouter平台的选择。如果一家公司已选定一家前沿实验室,那么直接联系Anthropic或OpenAI比通过加价的OpenRouter更划算。这在图表上看起来像是美国份额的下降,而实际上代币只是流向了平台之外。库雷希的结论是:OpenRouter有助于评估开源模型内部的份额,但完全不适合比较开源与闭源模型。
未来属于廉价模型
SageRoad Research创始人特雷弗·诺伦也表达了类似观点,并将其与行业面临的价格压力联系起来。他引用了摩根大通的评估:未来许多代币可能并非由前沿模型消耗,而是由足以完成特定任务的小型开源模型消耗。亚马逊已提供约五十种开源模型,价格仅为前沿模型的一小部分,而英伟达正与戴尔、联想和惠普合作,打造适用于AI代理的计算机。
该银行指出,Anthropic和OpenAI自家的小型模型Claude Haiku和GPT-5.4-mini目前在"效率前沿"上缺乏竞争力,而这一领域目前由中国开发者主导——DeepSeek、MiniMax、小米和阿里巴巴。
摩根大通给出的成本示例尤为直观:在Claude Opus 4.8上运行一套Artificial Analysis Intelligence Index任务集,成本为3700美元,得分为56分;而DeepSeek V4 Pro仅需186美元即可获得44分——成本相差约20倍。结论显而易见:前沿智能并非处处需要,只在必要时才用。与此同时,Z.ai的GLM 5.2看起来与Anthropic和OpenAI的顶级模型不相上下。
诺伦认为,模型的商品化不仅来自前沿实验室的竞争,也来自那些通过更便宜的专用模型来控制成本的公司。据他评估,企业支出仍是云巨头收回AI投资的最可行途径,但企业会尽可能少花钱。
两种观点在一点上达成共识:衡量人工智能市场应以金钱为准,而非代币;在价格压力下,优势正越来越多地转向廉价模型。
我的专业观点:库雷希和诺伦的论点并非单纯的学术讨论。对于加密货币和AI领域的投资者而言,这是一个关于衡量标准根本性转变的信号。如果市场开始根据货币收入而非"原始"消耗量来重新评估模型,我们将看到资本重新分配,流向那些展示出真实变现能力、而非仅仅制造代币噪音的项目。这对于与去中心化计算网络相关的代币评估尤为关键。