Intel, SambaNova y Foxconn están construyendo racks listos para producción que dividen la inferencia de IA entre tres arquitecturas de chips.
Intel, SambaNova y Foxconn están construyendo racks listos para producción que dividen la inferencia de IA entre tres arquitecturas de chips.

Intel, SambaNova y Foxconn están construyendo racks listos para producción que dividen la inferencia de IA entre tres arquitecturas de chips.
Intel demostró el lunes en Computex 2026 en Taipéi un sistema de inferencia desacoplado que separa las fases de prellenado y decodificación de la inferencia de IA entre distintos procesadores. El sistema, impulsado por la plataforma de centro de datos Vector Core Compute de Intel y orquestado por sus procesadores Xeon 6, utiliza la SN40 RDU de SambaNova para la decodificación y la GPU Blackwell de Nvidia para el prellenado. Foxconn, el fabricante de electrónica más grande del mundo, proporcionó soporte de integración de sistemas y exhibió racks listos para producción en la feria.
"Esta arquitectura permite a los clientes optimizar cada fase de la inferencia de forma independiente, en lugar de forzar todo a través de un único pipeline de GPU", declaró un representante de Intel en el evento. El enfoque aborda una ineficiencia estructural en las implementaciones actuales de IA: el prellenado —la primera pasada computacionalmente intensiva que procesa la solicitud del usuario— y la decodificación —la generación token por token de una respuesta— tienen requisitos de hardware diferentes que un solo tipo de chip no puede satisfacer de manera eficiente.
El modelo desacoplado aborda un punto crítico creciente para las empresas que ejecutan modelos de lenguaje de gran escala en producción. El prellenado exige gran ancho de banda de memoria y cómputo matricial, áreas donde las GPUs H100 y Blackwell de Nvidia destacan. La decodificación, por el contrario, es más sensible a la latencia y se beneficia de la arquitectura especializada de flujo de datos de la RDU (unidad de flujo de datos reconfigurable) de SambaNova. Al dividir la carga de trabajo, el Xeon 6 de Intel actúa como orquestador, dirigiendo cada fase al procesador óptimo.
Intel también anunció su línea de procesadores Xeon 6+ y servicios en la nube para agentes de inferencia desacoplada, ampliando su incursión en el mercado de centros de datos de IA, donde Nvidia ha capturado aproximadamente el 80% de los ingresos por silicio para entrenamiento e inferencia. La asociación con SambaNova —una startup valorada en más de $5,000 millones tras su ronda de financiación de 2024— y Foxconn le otorga a Intel un socio de fabricación e integración capaz de entregar racks completos, no solo chips.
El momento es estratégico. Nvidia aprovechó su propia conferencia magistral en Computex el lunes para presentar el RTX Spark Superchip, su primer procesador de consumo para PC, y confirmó que su plataforma de centro de datos Vera Rubin ha entrado en producción completa. Los ingresos de Nvidia en centros de datos alcanzaron los $35,600 millones en su trimestre fiscal más reciente, superando con creces el segmento de centros de datos e IA de Intel, que registró $4,100 millones. Sin embargo, la apuesta de Intel por la inferencia heterogénea —utilizando múltiples tipos de chips en una sola carga de trabajo— ofrece una propuesta de valor diferenciada para las empresas que desean evitar un bloqueo total al ecosistema CUDA de Nvidia.
Para los inversores, la cuestión es si Intel puede convertir esta arquitectura en ingresos. Los ingresos de centros de datos e IA de Intel cayeron un 8% interanual en su trimestre más reciente, y la compañía ha tenido dificultades para recuperar la cuota de mercado perdida frente a Nvidia y AMD en cómputo de IA. La asociación con Foxconn proporciona un camino hacia la producción en volumen: la capacidad del fabricante por contrato para integrar, probar y enviar racks completos a escala podría acelerar la adopción empresarial. Las acciones de Intel han subido aproximadamente un 200% en lo que va del año gracias al optimismo en torno a su recuperación, pero la compañía aún cotiza con descuento frente al múltiplo de ganancias futuras de 35 veces de Nvidia.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.