Baseten recauda 1.500 millones de dólares mientras la demanda de inferencia de IA se multiplica por 20

La empresa de infraestructura de inferencia que impulsa aplicaciones de IA para Cursor, Abridge y OpenEvidence se ha convertido en una de las empresas privadas de mayor crecimiento en tecnología, con ingresos que saltaron aproximadamente 20 veces interanual a medida que las empresas trasladan el gasto en modelos hacia implementaciones personalizadas y de código abierto.

Baseten, la empresa de inferencia de IA con sede en San Francisco, cerró una financiación Serie F de 1.500 millones de dólares liderada por Altimeter Capital, Conviction y Spark Capital, con Sands Capital y Wellington Management como co-líderes. La ronda se estructuró en dos tramos con valoraciones de 13.000 millones y 11.000 millones de dólares respectivamente, una estructura cada vez más común en rondas de IA de alto momento que permite a diferentes clases de inversores entrar en condiciones negociadas.

"El futuro de la IA se construirá sobre millones de modelos especializados, y las empresas que construyen los mejores saben que el post-entrenamiento se ha vuelto existencial", dijo Tuhin Srivastava, CEO y cofundador de Baseten. "Es así como construyen inteligencia que poseen, con datos que son suyos, optimizados para los clientes a los que sirven".

La plataforma de Baseten procesa ahora más de 1.000 millones de llamadas de inferencia cada día en 87 clústeres que abarcan 18 proveedores de nube. La arquitectura multinube de la empresa —un punto de venta clave— permite a las empresas implementar modelos de código abierto de Meta, Mistral y DeepSeek junto con modelos frontera propietarios sin dependencia de una sola nube. Las principales empresas de capa de aplicación ahora dirigen entre el 30 % y el 50 % del gasto en modelos hacia modelos personalizados y post-entrenados, según Baseten, a medida que la calidad del código abierto converge con las alternativas propietarias a una fracción del costo.

La base técnica es Truss, un framework de código abierto que empaqueta modelos de aprendizaje automático en API de producción con un único archivo de configuración. Los desarrolladores especifican el modelo, el hardware y la configuración de optimización en un archivo YAML, y Baseten compila un contenedor TensorRT-LLM, lo despliega en su red en la nube y devuelve un endpoint compatible con OpenAI. Para flujos de trabajo compuestos de IA —tuberías de voz que encadenan pasos de voz a texto, modelo de lenguaje y texto a voz— la capa Truss Chains de la plataforma transmite datos directamente entre los pasos del modelo, logrando una latencia de extremo a extremo inferior a 400 milisegundos.

El mercado de inferencia está creciendo más rápido que casi cualquier cosa que hayamos visto

La ronda de financiación culmina una trayectoria de valoración notable. Baseten recaudó una Serie D de 150 millones de dólares con una valoración de 2.150 millones en septiembre de 2025, seguida de una Serie E de 300 millones a 5.000 millones en enero de 2026 que incluyó 150 millones de Nvidia. El salto de valoración de aproximadamente 6 veces en menos de un año refleja un cambio estructural en la economía de la IA: Deloitte proyectó en noviembre de 2025 que las cargas de trabajo de inferencia representarían aproximadamente dos tercios de toda la computación de IA en 2026, frente a un tercio tres años antes, con el mercado de inferencia superando los 50.000 millones de dólares solo en gasto en chips este año.

Los costos de inferencia de LLM han caído aproximadamente 1.000 veces desde finales de 2022, haciendo que las aplicaciones de agentes sean económicamente viables a escala de producción. Al menos un cliente de Baseten reporta costos de inferencia de aproximadamente el 30 % de lo que cobran las alternativas de código cerrado por cargas de trabajo equivalentes, según la investigación de Sacra.

"Tuhin y el equipo de Baseten hicieron una apuesta hace seis años que la mayoría de la gente no estaba lista para hacer: que el futuro de la IA se construiría sobre muchos modelos especializados, y que las empresas que los construyeran necesitarían infraestructura de clase mundial para hacerlos realidad", dijo Apoorv Agrawal, socio de Altimeter Capital. "Esa apuesta está dando sus frutos de una manera difícil de exagerar".

Despliegue de capital y posicionamiento competitivo

Baseten planea triplicar su plantilla este año, invirtiendo en equipos de ingeniería, investigación, operaciones y go-to-market empresarial. La empresa ha recaudado más de 2.000 millones de dólares hasta la fecha de inversores como Altimeter, Battery Ventures, Blackbird, Greylock, IVP, Nvidia, Spark Capital y Wellington Management.

El panorama competitivo incluye hiperescaladores de nube que ofrecen servicios de inferencia gestionados —Amazon Bedrock, Google Vertex AI y Microsoft Azure AI— así como proveedores especializados en inferencia como Together AI y Fireworks AI. La diferenciación de Baseten reside en su independencia multinube y su enfoque en modelos personalizados y post-entrenados, en lugar de capacidad de inferencia compartida para modelos populares. La empresa se dirige a empresas que no pueden tolerar la variabilidad de latencia de los endpoints compartidos y necesitan asignaciones dedicadas de GPU para modelos ajustados.

Para los inversores, la historia de Baseten refleja una tesis más amplia: a medida que los modelos fundacionales se mercantilizan, el margen duradero en la IA se está desplazando hacia la capa de infraestructura que los orquesta. La trayectoria de ingresos de la empresa —de aproximadamente 200 a 600 millones de dólares anualizados en un solo trimestre, según informes anteriores— sugiere que el mercado ya está valorando ese cambio. Los clientes de Baseten incluyen algunas de las empresas privadas de IA más valiosas, y su plataforma se sitúa en la intersección de dos tendencias estructurales: la proliferación de modelos especializados y la necesidad empresarial de flexibilidad multinube.

Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.