28.06.2026
17:52
Coinbase在AI消耗激增的情况下将成本减半:代币工程学的秘密
Coinbase首席执行官布莱恩·阿姆斯特朗分享了一项出人意料的策略:尽管代币消耗呈指数级增长,该公司却成功将人工智能成本削减近半。秘诀并非严苛限制或禁止,而在于合理的路由、缓存及默认设置。
阿姆斯特朗解释称,Coinbase工程师可自由选择任何模型,但默认设置至关重要。公司正尝试通过内部网关默认使用GLM 5.2和Kimi 2.7等开源权重模型。值得注意的是,91%的员工从未触及使用上限,因此Coinbase转而采用更经济的默认配置,而非降低限额。
路由、缓存与上下文节约
在Coinbase自有系统中,请求会经过预处理,并根据缓存命中率和成本被导向最合适的模型。例如,前沿模型适合规划任务,但用于执行则过于冗余。模型选择应由AI自动完成,而非人工干预。
阿姆斯特朗特别强调了缓存的重要性。未命中缓存数据是推高成本的最简单途径,因此Coinbase所有请求均配置为复用已处理信息。在LibreChat服务中,正确配置后缓存命中率从5%提升至60%。
上下文节约也成为关键因素。阿姆斯特朗建议切换任务时开启新会话,严格限制文件上下文范围,并关闭未使用的工具。目标并非减少代币消耗,而是减少无效浪费。
多伊彻的"杠铃"策略
分析师迈尔斯·多伊彻描述了类似方法,将其称为"代币工程",并提出"杠铃"策略以实现AI成本削减50%以上。他建议将前10%的工作和项目规划交给Opus或GPT等最智能模型;80%的常规任务由更便宜的开源模型完成;最后10%及结果验证再次使用高端模型。多伊彻已采用该方案数月,认为这是降低AI过度支出的最佳方式。
专家观点: Coinbase策略不仅是成本节约,更树立了企业AI新标准。通过"重型"与"轻量"模型的任务分工,结合智能缓存技术,可在不按比例增加预算的情况下扩展AI应用规模。这给整个行业的启示是:效率比蛮力更重要。