Coinbase、中国製オープンソースモデル採用でAI支出を約50％削減

Coinbaseのブライアン・アームストロング最高経営責任者（CEO）は、同社が中国製オープンソースモデルGLM 5.2とKimi 2.7を社内LLMゲートウェイ経由でデフォルトオプションとして設定することでAI支出を約50％削減した一方、トークン使用量は指数関数的に増加し続けていると述べた。

「エンジニアの91％は使用量上限に達したことがないため、上限を厳格化するのではなく、より安価なデフォルトモデルに切り替えた」とアームストロング氏は金曜日にX（旧Twitter）への投稿で述べた。

暗号資産取引所である同社は、3つのコスト削減策を導入した。すなわち、プロンプトを前処理し、キャッシュヒット率と価格設定に基づいて最も費用対効果の高いモデルにタスクを割り当てるスマートルーティングシステム、LibreChatのキャッシュヒット率を5％から60％に引き上げたアグレッシブなキャッシング、そしてエンジニアがタスクを切り替える際に新しいセッションを開始することを要求するコンテキストの合理化である。複雑な計画や推論には、エンジニアは引き続きフロンティアモデルを呼び出すことができ、コードレビューでは出力を相互検証するマルチモデル並列戦略が採用されている。

今回の移行は、中国製オープンソースAIが西側企業の本番環境において商業的に viable であることを実証し、OpenAIやAnthropicといった米国プロバイダーの価格決定権に直接挑戦するものだ。Coinbaseにとって、このコスト削減は、同社がAI利用を制限するのではなく拡大している時期に、利益率や収益性指標の改善につながる可能性がある。

スマートルーティングが手動によるモデル選択に取って代わる

アームストロング氏によると、同社のカスタムスケジューリングフレームワークはすべてのプロンプトを前処理し、キャッシュヒット確率とトークン単価に基づいて最適なモデルに自動的にルーティングする。目標は、モデル選択をエンジニアに任せるのではなく、AIに処理させることだと述べた。実行レベルのタスクには、最も高価なフロンティアモデルは必要なく、計画や推論のタスクにのみ必要だと同氏は主張した。

キャッシングとコンテキスト管理がコスト削減の大部分を牽引

Coinbaseは現在、すべてのAIリクエストをキャッシュ対応にすることを義務付けており、システムは新しいレスポンスを生成する前に、以前のレスポンスを再利用できるかどうかをチェックする。LibreChatの実装はその効果を示している。最適化後、キャッシュヒット率は5％から60％に跳ね上がった。アームストロング氏はまた、エンジニアに対し、コンテキストウィンドウを小さく保つこと（新しいセッションを開始する、ファイルスコープを絞る、未使用のツールを切断するなど）を促し、無駄なトークン消費を削減した。

同社は絶対的な支出額を開示していない。しかし、トークン使用量が指数関数的に増加する中で約50％の削減を達成したことは、Coinbaseが消費とコストを部分的に切り離したことを示唆している。

AI市場にとっての意味

北京に拠点を置くZhipu AIが開発したGLM 5.2と、北京 Moonshot AI が開発したKimi 2.7をデフォルトのエンタープライズモデルとして採用したことは、西側企業のインフラにおける中国製オープンソースAIのマイルストーンとなる。プレミアム価格を設定するOpenAIのGPT-4oやAnthropicのClaude 4は、日常的なタスクにおいて品質を犠牲にすることなく企業が導入できる、信頼性の高い低コストの代替手段に直面している。

投資家にとっての示唆は明らかだ。他の大企業がCoinbaseの手法に追随すれば、米国のプレミアムAIモデルが対象とする市場は高複雑性タスクのみに縮小し、企業全体での導入に依存するプロバイダーの収益成長期待を圧迫する可能性がある。ナスダックにCOINとして上場するCoinbaseは正確なドルベースの削減額を開示していないが、構造的なコスト改善はAI利用の拡大に伴うマージン拡大を支える。

本記事は情報提供のみを目的としており、投資助言を構成するものではない。