Baseten recauda 1.500 millones apostando por modelos de IA de código abierto más baratos

La recaudación de 1.500 millones de dólares de Baseten señala que el gasto empresarial en IA está virando desde los modelos cerrados premium hacia alternativas de código abierto más económicas.

Baseten, una startup de IA que construye infraestructura de inferencia para modelos de código abierto, está ultimando una ronda de financiación de 1.500 millones de dólares con una valoración de hasta 13.000 millones, la última apuesta de que las empresas trasladarán su gasto en IA desde modelos cerrados premium hacia alternativas más baratas.

"Los modelos de código abierto están volviéndose muy, muy buenos", declaró Tuhin Srivastava, cofundador y consejero delegado de Baseten. "Y a medida que el código abierto mejora, nosotros crecemos con él".

La ronda utiliza una estructura de dos niveles, con algunos inversores participando a una valoración de 11.000 millones de dólares y otros a 13.000 millones, según la compañía. Altimeter Capital, Conviction, Spark Capital, Sands Capital y Wellington Management lideran la inversión — la primera incursión de Wellington en la inferencia de IA. La capa de software de Baseten se asienta sobre capacidad de cómputo obtenida de 20 proveedores en la nube, ofreciendo a los clientes la infraestructura para ejecutar, optimizar y entrenar modelos de código abierto sin gestionar hardware.

La apuesta refleja un cambio de mercado más amplio. La brecha de calidad entre los modelos de código abierto y los de código cerrado se ha reducido de dos años en 2023 a apenas semanas en puntos de referencia clave de ingeniería hoy en día, según pruebas independientes. DeepSeek-V4, un modelo abierto de 1,6 billones de parámetros, cuesta aproximadamente 87 centavos por millón de tokens de salida — aproximadamente una treintava parte del precio frontera de OpenAI y Anthropic. Si las empresas redirigen aunque sea una fracción de su gasto en IA hacia alternativas de código abierto, las proyecciones de ingresos que sustentan el despliegue de centros de datos por más de 200.000 millones de dólares podrían enfrentar serias presiones.

La Capa de Inferencia se Convierte en un Negocio

Baseten forma parte de un ecosistema creciente de startups que capitalizan el auge de la inferencia — el proceso mediante el cual los modelos de IA utilizan potencia de cómputo para responder a consultas. Cerebras, que diseñó chips específicamente para inferencia, salió a bolsa en mayo y ahora cuenta con una capitalización de mercado de casi 50.000 millones de dólares. Fireworks AI recaudó fondos en octubre con una valoración de 4.000 millones de dólares, y Factory, una startup que construye agentes de codificación autónomos, alcanzó los 1.500 millones en abril.

La economía está impulsando la adopción. Un cliente de Baseten le dijo a Srivastava que realizó una tarea específica al 30% del costo requerido por un modelo de código cerrado. La mayoría de los clientes de Baseten utilizan una combinación de modelos abiertos y cerrados, recurriendo a sistemas frontera solo para tareas que requieren el mejor rendimiento absoluto, mientras enrutan cargas de trabajo rutinarias hacia alternativas más baratas.

"Los modelos de código abierto siempre están a unos meses de distancia de los modelos frontera, pero pueden servir para muchos casos de uso mientras ahorran una parte del uso de tokens para lo absolutamente mejor", dijo Oz Nur, inversor de Wellington Management.

La Ofensiva China del Código Abierto

Los modelos de código abierto más populares hoy provienen de laboratorios chinos. Las series V4 de DeepSeek y GLM-5.2 de Z.ai han registrado puntuaciones de referencia que rivalizan o superan a los principales modelos estadounidenses en tareas de ingeniería. GLM-5.2 obtuvo 81,0 en Terminal-Bench 2.1, frente al 62 de la versión anterior lanzada semanas antes. Cuenta con una ventana de contexto de un millón de tokens y cuesta aproximadamente una sexta parte de los principales modelos cerrados estadounidenses por token.

Las empresas estadounidenses intentan ponerse al día. Nvidia lanzó recientemente Nemotron, una familia de modelos de código abierto, mientras Meta continúa desarrollando su serie Llama. Pero los laboratorios chinos iteran más rápido — GLM pasó de la versión 5.0 a la 5.2 en cuatro meses, con cada lanzamiento entrenado en silicio nacional.

El Cálculo del Inversor

Para los inversores, las matemáticas son sencillas. El costo de una salida de clase GPT-4 cayó de aproximadamente 20 dólares por millón de tokens a finales de 2022 a unos 40 centavos hoy — una disminución de casi mil veces. Esa deflación se detuvo este año debido a la escasez de memoria, pero la nueva capacidad de fabricación que entrará en funcionamiento podría reanudar la tendencia. Mientras tanto, DGX Spark de Nvidia, una máquina de escritorio de 4.700 dólares con 128 gigabytes de memoria unificada, ahora puede ejecutar modelos de hasta 200.000 millones de parámetros localmente.

Si los modelos abiertos de calidad frontera funcionan en hardware local asequible, la demanda de inferencia centralizada que justifica los programas de depreciación a cinco años de las GPU en centros de datos podría crecer más lentamente de lo esperado. Michael Burry ha señalado aproximadamente 176.000 millones de dólares en depreciación subestimada en toda la industria hasta 2028, y aproximadamente la mitad de los proyectos de centros de datos estadounidenses planificados para 2026 ya enfrentan retrasos o cancelaciones.

Los clientes de Baseten incluyen a Cursor, Mercor y OpenEvidence. The Information informó anteriormente sobre la recaudación de fondos.

Este artículo es solo con fines informativos y no constituye asesoramiento de inversión.