Intel、SambaNova、Foxconnは、AI推論を3つのチップアーキテクチャに分散する本番対応ラックを構築している。
Intel、SambaNova、Foxconnは、AI推論を3つのチップアーキテクチャに分散する本番対応ラックを構築している。

Intel、SambaNova、Foxconnは、AI推論を3つのチップアーキテクチャに分散する本番対応ラックを構築している。
Intelは月曜日、台北で開催されたComputex 2026において、AI推論のプリフィル(事前入力処理)フェーズとデコーディング(応答生成)フェーズを異なるプロセッサ間で分離する、分離型推論システムをデモンストレーションした。このシステムは、IntelのVector Core Computeデータセンタープラットフォームを搭載し、Xeon 6プロセッサでオーケストレーションされ、デコーディングにSambaNovaのSN40 RDU、プリフィルにNvidiaのBlackwell GPUを採用している。世界最大の電子機器メーカーであるFoxconnはシステムインテグレーションを支援し、イベントでは本番対応のラックを展示した。
「このアーキテクチャにより、顧客はすべてを単一のGPUパイプラインに強制するのではなく、推論の各フェーズを個別に最適化できるようになる」と、Intelの担当者はイベントで述べた。このアプローチは、現在のAI導入における構造的な非効率性を標的としている。すなわち、ユーザーのプロンプトを処理する計算負荷の高い最初のパスであるプリフィルと、トークンごとに応答を生成するデコーディングでは、単一のチップタイプでは効率的に満たせない異なるハードウェア要件が求められるという点である。
分離型モデルは、大規模言語モデルを本番運用する企業にとって深刻化する課題に対処する。プリフィルは高いメモリ帯域幅とマトリックス計算を必要とし、この分野ではNvidiaのH100およびBlackwell GPUが優れている。一方、デコーディングはレイテンシにより敏感であり、SambaNovaのRDU(再構成可能データフローユニット)の特殊化されたデータフローアーキテクチャが有効となる。ワークロードを分割することで、IntelのXeon 6がオーケストレーターとして機能し、各フェーズを最適なプロセッサにルーティングする。
Intelはまた、Xeon 6+プロセッサラインと、分離型推論のためのエージェントクラウドサービスを発表し、Nvidiaがトレーニングおよび推論シリコン収益の推定80%を掌握するAIデータセンター市場への攻勢を強化した。2024年の資金調達ラウンドで評価額が50億ドルを超えたスタートアップSambaNova、およびFoxconnとの提携により、Intelはチップだけでなく完全なラックを提供可能な製造およびインテグレーションパートナーを獲得した。
このタイミングは戦略的である。Nvidiaは月曜日、自身のComputex基調講演で、同社初のコンシューマーPCプロセッサとなるRTX Sparkスーパーチップを発表し、Vera Rubinデータセンタープラットフォームが本格生産に入ったことを確認した。Nvidiaのデータセンター収益は直近の会計四半期で356億ドルに達し、41億ドルだったIntelのデータセンターおよびAIセグメントを大きく上回る。しかし、単一のワークロードで複数のチップタイプを使用するヘテロジニアス推論に賭けるIntelの戦略は、NvidiaのCUDAエコシステムへの完全なベンダーロックインを回避したい企業にとって、差別化された価値提案を提供する。
投資家にとっての問いは、Intelがこのアーキテクチャを収益に転換できるかどうかである。IntelのデータセンターおよびAI収益は直近四半期に前年同期比で8%減少し、同社はAIコンピューティングにおいてNvidiaやAMDに奪われたシェアを回復するのに苦戦している。Foxconnとの提携は量産への道筋を提供する。同受託製造業者が大規模なラックの統合、テスト、出荷を可能とする能力は、エンタープライズでの採用を加速させる可能性がある。Intelの株価はターンアラウンドへの期待から年初来で約200%上昇しているが、同社は依然としてNvidiaの35倍のフォワードPERに対して割安で取引されている。
本記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。