Simuler un cluster de 50 000 GPU avant qu'un seul rack ne soit installé marque un changement dans la manière dont l'infrastructure IA est construite — et par qui elle peut être construite.
IREN Ltd. s'associe à BE Networks pour utiliser la plateforme de simulation NVIDIA DSX Air afin de valider l'architecture réseau de son prochain déploiement de plus de 50 000 GPU NVIDIA Blackwell Ultra, ont annoncé les entreprises lundi. L'initiative crée un jumeau numérique représentatif de la production de l'environnement cloud IA d'IREN avant le déploiement de l'infrastructure physique, permettant aux entreprises de modéliser le comportement du cluster, de valider les topologies réseau et de tester les workflows d'automatisation — répondant à ce qui est devenu un goulot d'étranglement dans les déploiements d'IA à grande échelle.
« L'infrastructure cloud IA à cette échelle nécessite une extrême précision », a déclaré Denis Skrinnikoff, directeur technologique chez IREN. « En combinant NVIDIA DSX Air avec l'expertise en automatisation de BE Networks, nous pouvons valider les décisions critiques de conception et d'exploitation avant le déploiement, réduire les risques d'intégration et mettre en ligne la capacité client avec une plus grande confiance. »
L'environnement de simulation couvre l'ensemble de la pile d'usine IA de NVIDIA — le calcul Blackwell Ultra, le tissu Ethernet Spectrum-X et la mise en réseau évolutive NVLink — aux côtés des couches de stockage, d'orchestration et de sécurité. BE Networks soutiendra le déploiement avec sa plateforme d'automatisation Verity, traduisant les conceptions validées en workflows reproductibles couvrant la conception du jour 0, la mise en service du jour 1 et les opérations du jour 2. Cette approche vise à réduire les délais de validation de plusieurs mois à quelques semaines, selon Gilad Shainer, vice-président senior du réseau chez NVIDIA.
« Les usines d'IA comptent parmi les systèmes les plus complexes jamais construits, et la simulation devient essentielle pour les déployer rapidement et à grande échelle », a déclaré Shainer.
La plateforme DSX s'étend à travers l'écosystème
Ce déploiement intervient alors que NVIDIA étend sa plateforme DSX, annoncée au GTC Taipei le 31 mai, qui regroupe des bibliothèques logicielles open source, des conceptions de référence et des technologies partenaires dans un cadre unifié pour la conception et l'exploitation d'usines d'IA. Les partenaires cloud, dont CoreWeave, Crusoe, Firmus, Lambda, Nebius, Nscale et Yotta Data Services, déploient déjà les composants DSX — DSX Sim, DSX MaxLPS et DSX OS — pour réduire les risques et améliorer l'utilisation des GPU.
Côté matériel, Dell Technologies, Hewlett Packard Enterprise, Lenovo et Supermicro construisent des systèmes compatibles DSX aux côtés des fabricants taïwanais ASUS, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology, Wistron et Wiwynn. Les intégrateurs système Quanta Cloud Technology et Pegatron travaillent avec Dassault Systèmes pour créer un configurateur de jumeau numérique d'usine d'IA en direct qui automatise la conception du rack à l'installation.
Ce que la simulation signifie pour la course à l'infrastructure IA
Pour IREN, la capacité de simuler avant de construire réduit les risques d'intégration à un moment où les fournisseurs de cloud IA subissent une pression pour mettre en ligne leur capacité plus rapidement tout en maintenant la fiabilité. Le modèle verticalement intégré de l'entreprise — possédant à la fois l'infrastructure des centres de données et les clusters GPU dans des régions riches en énergies renouvelables en Amérique du Nord, en Europe et en Asie-Pacifique — la positionne pour concurrencer les grands hyperscalers pour les charges de travail d'entraînement et d'inférence IA.
Cette approche abaisse également la barrière pour les petits fournisseurs de cloud souhaitant déployer à une complexité hyperscale. En validant les conceptions réseau dans un environnement virtuel, les entreprises peuvent éviter des reprises coûteuses lors du déploiement physique — un risque qui a retardé des projets d'usines d'IA dans toute l'industrie. Shainer de NVIDIA a déclaré que DSX permet aux organisations de valider les conceptions d'infrastructure en semaines au lieu de mois et de déployer des logiciels en jours au lieu de semaines.
Pour les investisseurs, le partenariat signale que le développement de l'infrastructure IA reste sur une trajectoire agressive. Le cluster de 50 000 GPU d'IREN, s'il est déployé avec succès, figurerait parmi les plus grands supercalculateurs d'IA sur un site unique, concurrençant les clusters exploités par CoreWeave et Lambda. L'entreprise n'a pas divulgué le montant total des dépenses d'investissement pour le déploiement ni le calendrier de mise en service du cluster.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.