Simular un clúster de 50.000 GPU antes de instalar un solo rack marca un cambio en la forma en que se construye la infraestructura de IA, y en quién puede construirla.
IREN Ltd. se está asociando con BE Networks para utilizar la plataforma de simulación DSX Air de NVIDIA con el fin de validar la arquitectura de red de su próximo despliegue de más de 50.000 GPU NVIDIA Blackwell Ultra, informaron las empresas el lunes. La iniciativa crea un gemelo digital representativo de producción del entorno de nube de IA de IREN antes de que se despliegue la infraestructura física, permitiendo a las empresas modelar el comportamiento del clúster, validar topologías de red y probar flujos de trabajo de automatización, abordando lo que se ha convertido en un cuello de botella en los despliegues de IA a gran escala.
"La infraestructura de nube de IA a esta escala requiere una precisión extrema", dijo Denis Skrinnikoff, director de tecnología de IREN. "Al combinar NVIDIA DSX Air con la experiencia en automatización de BE Networks, podemos validar decisiones críticas de diseño y operación antes del despliegue, reducir el riesgo de integración y poner la capacidad del cliente en línea con mayor confianza".
El entorno de simulación cubre toda la pila de fábrica de IA de NVIDIA — computación Blackwell Ultra, tejido Ethernet Spectrum-X y redes de escalado NVLink — junto con capas de almacenamiento, orquestación y seguridad. BE Networks respaldará el despliegue con su plataforma de automatización Verity, traduciendo diseños validados en flujos de trabajo repetibles en las operaciones de Día 0 (diseño), Día 1 (activación) y Día 2 (operaciones). El enfoque busca comprimir los plazos de validación de meses a semanas, según Gilad Shainer, vicepresidente senior de redes de NVIDIA.
"Las fábricas de IA se encuentran entre los sistemas más complejos jamás construidos, y la simulación se está volviendo esencial para desplegarlos a velocidad y escala", dijo Shainer.
La plataforma DSX se expande a través del ecosistema
El despliegue se produce mientras NVIDIA expande su plataforma DSX, anunciada en GTC Taipei el 31 de mayo, que agrupa bibliotecas de software de código abierto, diseños de referencia y tecnologías de socios en un marco unificado para el diseño y operación de fábricas de IA. Socios de nube como CoreWeave, Crusoe, Firmus, Lambda, Nebius, Nscale y Yotta Data Services ya están desplegando componentes de DSX — DSX Sim, DSX MaxLPS y DSX OS — para reducir el riesgo y mejorar la utilización de GPU.
En el lado del hardware, Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro están construyendo sistemas preparados para DSX, junto con fabricantes taiwaneses como ASUS, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology, Wistron y Wiwynn. Los integradores de sistemas Quanta Cloud Technology y Pegatron están trabajando con Dassault Systèmes para crear un configurador de gemelo digital de fábrica de IA en vivo que automatiza el diseño del rack a la instalación.
Lo que la simulación significa para la carrera de infraestructura de IA
Para IREN, la capacidad de simular antes de construir reduce el riesgo de integración en un momento en que los proveedores de nube de IA enfrentan la presión de poner capacidad en línea más rápido mientras mantienen la confiabilidad. El modelo verticalmente integrado de la compañía — que posee infraestructura de centros de datos y clústeres de GPU en regiones ricas en energías renovables de América del Norte, Europa y Asia Pacífico — la posiciona para competir con los grandes hiperescaladores en cargas de trabajo de entrenamiento e inferencia de IA.
El enfoque también reduce la barrera para que proveedores de nube más pequeños desplieguen con complejidad de hiperescala. Al validar diseños de red en un entorno virtual, las empresas pueden evitar costosos retrabajos durante el despliegue físico, un riesgo que ha retrasado proyectos de fábricas de IA en toda la industria. Shainer, de NVIDIA, dijo que DSX permite a las organizaciones validar diseños de infraestructura en semanas en lugar de meses, y desplegar software en días en lugar de semanas.
Para los inversores, la asociación señala que la construcción de infraestructura de IA continúa en una trayectoria agresiva. El clúster de 50.000 GPU de IREN, si se despliega con éxito, se ubicaría entre los supercomputadores de IA de sitio único más grandes, compitiendo con clústeres operados por CoreWeave y Lambda. La compañía no reveló el gasto de capital total para el despliegue ni un cronograma de cuándo estará operativo el clúster.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.