加密新闻

29.06.2026
06:38

Coinbase将AI成本削减一半:工程优化如何战胜代币消耗增长

Coinbase首席执行官布莱恩·阿姆斯特朗分享了一个重要案例:尽管代币消耗呈指数级增长,该公司仍成功将人工智能成本削减近半。关键结论是,效率提升并非通过严格的限额和支出通知实现,而是依靠合理配置默认设置、优化请求路由和缓存机制。

阿姆斯特朗强调,工程师可以自由选择任何模型,但默认设置才是决定性因素。Coinbase通过内部网关尝试使用更便宜的开源模型,如GLM 5.2和Kimi 2.7。值得注意的是,91%的员工从未触及使用限额,因此公司转向更经济的配置方案,而非降低限额。

路由、缓存与上下文节约

Coinbase内部系统会预处理请求,根据缓存命中率和成本将请求导向最合适的模型。例如,前沿模型对规划任务必不可少,但对执行任务则显得冗余。最终,模型选择应由AI自动完成,而非人工干预。

阿姆斯特朗特别强调了缓存的作用。未命中缓存数据是推高成本的最简单方式,因此Coinbase的所有请求都配置为复用已处理信息。在LibreChat服务中,经过正确配置后,缓存命中率从5%提升至60%。

上下文节约同样重要。阿姆斯特朗建议在切换任务时开启新会话,严格限制文件上下文范围,并关闭未使用的工具。目标不是减少代币消耗量,而是减少无效消耗。正是这种策略使Coinbase在消费持续增长的情况下,将成本削减近半。

多伊彻的"杠铃"策略

分析师迈尔斯·多伊彻描述了类似方法,并将其命名为"代币工程学"。他提出"杠铃"策略,可将AI成本降低50%甚至更多。项目前10%的规划工作应交给Opus或GPT等最智能模型;中间80%的常规任务由更便宜的开源模型完成;最后10%的结果验证则再次交由高端模型处理。多伊彻已采用该方案数月,认为这是降低AI过度支出的最佳方式。

专家点评:Coinbase案例展示了成熟的AI基础设施管理思路。公司没有恐慌性地削减访问权限,而是引入智能路由和缓存机制,这是明智的工程决策。对于每一分钱都要精打细算的加密行业而言,这种务实态度不仅是节约成本,更是在日益激烈的竞争中实现可持续规模扩张的关键。