Coinbase:已将 AI 支出削减近 50%,正尝试默认采用开放权重模型
ChainCatcher 消息,Coinbase CEO Brian Armstrong 发文介绍公司在 AI 成本优化方面的最新进展。
Armstrong 表示,随着 AI 使用量和 Token 消耗持续增长,控制成本的关键并非限制员工使用或频繁发送预算提醒,而是优化默认模型选择、任务路由机制以及缓存策略。
他透露,Coinbase 正通过内部 LLM 网关尝试将 GLM 5.2、Kimi 2.7 等开放权重模型作为默认选项,同时仍允许工程师根据具体任务需求选择其他模型。数据显示,公司 91% 的员工从未达到 AI 使用额度上限,因此 Coinbase 并未选择收紧配额,而是通过更低成本的模型方案提升整体效率。
在模型路由方面,Coinbase 会对提示词进行预处理,并结合缓存命中率及不同模型的定价情况,将任务自动分配给最合适的模型。Armstrong 认为,规划和推理等复杂任务可能需要前沿模型支持,但执行类任务未必需要调用成本更高的模型。未来,模型选择过程应更多由 AI 自动完成,而非依赖人工决策。
此外,他指出缓存命中率是影响 AI 成本的重要因素之一。Coinbase 已将缓存感知机制纳入请求流程,以提高历史结果复用率。以 LibreChat 为例,在优化缓存方案后,其缓存命中率已从 5% 提升至 60%。
Armstrong 还表示,公司要求工程师尽量保持上下文精简,包括切换任务时开启新会话、缩小文件上下文范围以及关闭未使用工具等,以减少不必要的 Token 消耗。
据其透露,通过上述措施,Coinbase 已成功将 AI 支出降低近 50%,同时 Token 使用量仍保持增长。