SpaceX n'a pas réussi à faire fonctionner son propre centre de données Colossus 1 pour entraîner Grok, et a donc loué l'ensemble de l'installation à Anthropic pour 1,25 milliard de dollars par mois.
Le centre de données Colossus 1 de SpaceX à Memphis était censé entraîner les modèles Grok les plus avancés de l'entreprise. Au lieu de cela, il est devenu une source de revenus de 1,25 milliard de dollars par mois pour Anthropic, après que les propres ingénieurs de SpaceX n'ont pas pu résoudre les problèmes de latence et d'incompatibilité matérielle, selon des personnes proches du dossier qui se sont confiées à Bloomberg.
« SpaceX a estimé que l'installation serait plus rentable en générant des revenus qu'en restant sous-utilisée », a déclaré Bret Johnsen, directeur financier de SpaceX, dans un communiqué. La société n'a pas abandonné ses travaux internes en IA, a-t-il ajouté, et conserve le droit de récupérer la capacité avec un préavis de 90 jours.
L'installation de plus de 300 mégawatts abrite plus de 220 000 GPU Nvidia couvrant plusieurs générations de puces — des systèmes Hopper et Blackwell aux côtés d'accélérateurs plus anciens. Cette hétérogénéité matérielle a créé des goulots d'étranglement dans l'entraînement distribué, où les puces les plus lentes forcent les plus rapides à attendre. Colossus 2 et 3, construits de manière plus uniforme autour des puces Blackwell, ont évité ce problème. Les liaisons réseau entre Colossus 1 et les deux autres campus, situés à plus de 16 km de distance, ont introduit une latence qui a rendu l'entraînement intersites impraticable.
Cet accord de location transforme SpaceX d'un concepteur d'IA en un propriétaire d'infrastructure d'IA. Combiné à un accord de 920 millions de dollars par mois avec Google à partir d'octobre, SpaceX perçoit environ 2,17 milliards de dollars par mois — soit 26 milliards de dollars annualisés — provenant d'une infrastructure de calcul qu'elle avait initialement construite pour elle-même. Les contrats, d'une valeur totale de plus de 700 milliards de dollars, sont devenus un élément central de la tournée de présentation aux investisseurs (roadshow) de l'introduction en bourse (IPO) de SpaceX, qui vise une valorisation d'environ 750 milliards de dollars.
Pourquoi Colossus 1 n'a pas pu entraîner Grok
SpaceX a construit Colossus 1 en 122 jours — une rapidité qu'elle a vantée lors de son roadshow d'IPO comme dépassant les moyennes du secteur. Mais la rapidité a eu un prix. L'inventaire matériel hétérogène de l'installation, combinant des accélérateurs Nvidia plus anciens avec des puces Hopper et Blackwell plus récentes, a créé des déséquilibres de performance qui ont dégradé l'efficacité de l'entraînement. Dans les clusters d'IA distribués, l'ensemble du système fonctionne à la vitesse de son composant le plus lent.
L'infrastructure réseau reliant Colossus 1 aux deux autres campus a aggravé le problème. L'entraînement de modèles de pointe nécessite des liaisons ultra-rapides et à faible latence entre les nœuds. Colossus 1 étant situé à plus de 16 km des autres sites, les équipements réseau plus anciens ne pouvaient pas maintenir la vitesse de synchronisation nécessaire pour les entraînements à grande échelle.
Résultat : le cluster d'entraînement à l'IA le plus ambitieux de SpaceX était effectivement bloqué. Plutôt que d'investir dans des mises à niveau réseau coûteuses et une standardisation matérielle, l'entreprise a choisi de monétiser la capacité en externe.
L'activité accidentelle de 26 milliards de dollars
Anthropic paie 1,25 milliard de dollars par mois jusqu'en mai 2029 pour l'accès aux installations Colossus 1 et Colossus II — soit environ 45 milliards de dollars sur trois ans. L'accord offre à Anthropic une bouée de sauvetage temporaire alors qu'elle peine à faire face à une demande imprévisible pour Claude, Claude Code et la famille de modèles Opus. Les utilisateurs ont signalé des limites de débit et une dégradation des performances aux heures de pointe, l'entreprise étant contrainte en capacité depuis des mois.
L'arrangement est temporaire : un bail de 180 jours avec une clause de résiliation réciproque de 90 jours. Musk a déclaré que SpaceX pourrait récupérer la capacité « si le calcul devenait extrêmement tendu ». Mais le déclin de l'attrait de Grok — les téléchargements sont passés de 20 millions en janvier à 8,3 millions en avril, avec un taux de conversion payant équivalant à un cinquième de celui de ChatGPT — rend cette récupération moins urgente.
Pour les investisseurs, ce pivot soulève des questions sur le récit de l'infrastructure IA de SpaceX. L'entreprise a présenté son déploiement de centres de données comme un avantage stratégique lors des roadshows d'IPO, en mettant l'accent sur la rapidité et l'échelle de la construction. La révélation que les limitations techniques de Colossus 1 ont forcé une location externe — à un concurrent, qui plus est — complique ce discours. Les critiques ont également remis en question la tarification du bail, la jugeant potentiellement supérieure aux taux du marché, et se sont interrogées sur la possibilité que la structure de l'accord implique un financement circulaire entre des entités liées à Musk.
Les actions de SpaceX ont ouvert à environ 150 dollars lors de leurs débuts au Nasdaq, soit une prime de 11 % par rapport au prix d'IPO, et ont bondi de jusqu'à 30 % dans les premiers échanges avant de clôturer en hausse de 19 %. L'action a brièvement poussé la valeur boursière de SpaceX au-dessus de 2 200 milliards de dollars.
La leçon plus large pour l'industrie de l'IA : posséder le matériel ne revient pas à pouvoir l'utiliser. La géographie, la mise en réseau et la complexité de l'intégration peuvent transformer un centre de données en capacité bloquée. Alors que les laboratoires de pointe se disputent des clusters de plus de 100 000 GPU, les contraintes physiques du calcul — et non seulement l'architecture des modèles — deviennent le goulot d'étranglement déterminant.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.