Coinbase在AI消耗激增的情况下将成本减半：代币工程学的秘密

28.06.2026

17:52

Coinbase首席执行官布莱恩·阿姆斯特朗分享了一项出人意料的策略：尽管代币消耗呈指数级增长，该公司却成功将人工智能成本削减近半。秘诀并非严苛限制或禁止，而在于合理的路由、缓存及默认设置。

阿姆斯特朗解释称，Coinbase工程师可自由选择任何模型，但默认设置至关重要。公司正尝试通过内部网关默认使用GLM 5.2和Kimi 2.7等开源权重模型。值得注意的是，91%的员工从未触及使用上限，因此Coinbase转而采用更经济的默认配置，而非降低限额。

路由、缓存与上下文节约

在Coinbase自有系统中，请求会经过预处理，并根据缓存命中率和成本被导向最合适的模型。例如，前沿模型适合规划任务，但用于执行则过于冗余。模型选择应由AI自动完成，而非人工干预。

阿姆斯特朗特别强调了缓存的重要性。未命中缓存数据是推高成本的最简单途径，因此Coinbase所有请求均配置为复用已处理信息。在LibreChat服务中，正确配置后缓存命中率从5%提升至60%。

上下文节约也成为关键因素。阿姆斯特朗建议切换任务时开启新会话，严格限制文件上下文范围，并关闭未使用的工具。目标并非减少代币消耗，而是减少无效浪费。

多伊彻的"杠铃"策略

分析师迈尔斯·多伊彻描述了类似方法，将其称为"代币工程"，并提出"杠铃"策略以实现AI成本削减50%以上。他建议将前10%的工作和项目规划交给Opus或GPT等最智能模型；80%的常规任务由更便宜的开源模型完成；最后10%及结果验证再次使用高端模型。多伊彻已采用该方案数月，认为这是降低AI过度支出的最佳方式。

专家观点： Coinbase策略不仅是成本节约，更树立了企业AI新标准。通过"重型"与"轻量"模型的任务分工，结合智能缓存技术，可在不按比例增加预算的情况下扩展AI应用规模。这给整个行业的启示是：效率比蛮力更重要。

加密新闻