주요 내용:
- Baseten이 130억 달러 기업가치로 15억 달러 규모 시리즈 F 투자 유치
- 연간 매출 전년 대비 약 20배 성장, 일일 추론 호출 10억 건 기록
- 이번 라운드는 오픈소스 모델이 독점 프론티어 모델과의 격차를 좁히면서 수요가 급증한 것을 반영
주요 내용:

Cursor, Abridge, OpenEvidence 등 AI 애플리케이션에 동력을 공급하는 추론 인프라 기업이 기술 업계에서 가장 빠르게 성장하는 비상장사 중 하나로 부상했다. 기업들이 모델 지출을 맞춤형 및 오픈소스 배포로 전환함에 따라 연간 매출이 전년 대비 약 20배 급증한 것이다.
샌프란시스코에 본사를 둔 AI 추론 기업 Baseten은 Altimeter Capital, Conviction, Spark Capital이 주도하고 Sands Capital과 Wellington Management가 공동 주도한 15억 달러 규모의 시리즈 F 투자를 마감했다. 이번 라운드는 각각 130억 달러와 110억 달러의 기업가치로 두 개의 트랜치로 구성됐는데, 이는 고모멘텀 AI 라운드에서 점점 보편화되는 구조로, 서로 다른 투자자 계층이 협상된 조건에 따라 참여할 수 있도록 해준다.
"AI의 미래는 수백만 개의 특화 모델 위에 구축될 것이며, 최고의 모델을 만드는 기업들은 포스트 트레이닝이 생존 문제가 되었음을 알고 있습니다."라고 Baseten의 CEO이자 공동창업자인 Tuhin Srivastava는 말했다. "이는 그들만의 데이터로, 그들이 서비스하는 고객에 최적화된, 그들 소유의 지능을 구축하는 방법입니다."
Baseten의 플랫폼은 현재 18개 클라우드 제공업체에 걸친 87개 클러스터에서 매일 10억 건 이상의 추론 호출을 처리한다. 회사의 핵심 판매 포인트인 멀티 클라우드 아키텍처는 기업들이 단일 클라우드에 종속되지 않고 Meta, Mistral, DeepSeek의 오픈소스 모델을 독점 프론티어 모델과 함께 배포할 수 있게 해준다. Baseten에 따르면, 주요 앱 레이어 기업들은 이제 모델 지출의 30~50%를 맞춤형 및 포스트 트레이닝 모델에 할당하고 있으며, 이는 오픈소스 품질이 독점 대안에 비해 극히 일부의 비용으로 수렴하고 있기 때문이다.
기술적 기반은 Truss로, 단일 구성 파일로 머신러닝 모델을 프로덕션 API로 패키징하는 오픈소스 프레임워크다. 개발자는 YAML 파일에 모델, 하드웨어 및 최적화 설정을 지정하면, Baseten이 TensorRT-LLM 컨테이너를 컴파일하고, 클라우드 네트워크에 배포한 후 OpenAI 호환 엔드포인트를 반환한다. 음성-텍스트, 언어 모델, 텍스트-음성 단계를 연결하는 음성 파이프라인과 같은 복합 AI 워크플로우의 경우, 플랫폼의 Truss Chains 레이어가 모델 단계 간에 데이터를 직접 스트리밍하여 엔드투엔드 지연 시간을 400밀리초 미만으로 달성한다.
추론 시장은 우리가 본 거의 모든 것보다 빠르게 복합 성장 중
이번 투자 라운드는 놀라운 기업가치 궤적의 정점을 찍었다. Baseten은 2025년 9월 21억 5000만 달러 기업가치로 1억 5000만 달러 규모의 시리즈 D를 조달했고, 2026년 1월에는 Nvidia로부터 1억 5000만 달러를 포함해 50억 달러 기업가치로 3억 달러 규모의 시리즈 E를 조달했다. 1년도 안 되어 약 6배의 기업가치 상승은 AI 경제의 구조적 변화를 반영한다. Deloitte는 2025년 11월, 추론 워크로드가 2026년 전체 AI 컴퓨팅의 약 3분의 2를 차지할 것으로 전망했으며, 이는 3년 전의 3분의 1에서 증가한 수치로, 올해 추론 시장의 칩 지출만 500억 달러를 초과할 것으로 예상된다.
LLM 추론 비용은 2022년 말 이후 약 1000분의 1 수준으로 하락하여, 에이전트 기반 애플리케이션이 프로덕션 규모에서 경제적으로 실행 가능해졌다. Sacra 리서치에 따르면, 최소 한 명의 Baseten 고객은 동등한 워크로드에 대해 폐쇄형 소스 대안이 청구하는 비용의 약 30% 수준으로 추론 비용을 보고했다.
"Tuhin과 Baseten 팀은 6년 전 대부분의 사람들이 할 준비가 되어 있지 않았던 베팅을 했습니다. AI의 미래는 많은 특화 모델 위에 구축될 것이며, 이를 구축하는 기업들은 이를 현실로 만들기 위해 세계적 수준의 인프라가 필요할 것이라는 베팅이었습니다."라고 Altimeter Capital의 파트너 Apoorv Agrawal은 말했다. "그 베팅은 과장하기 어려울 정도로 성과를 내고 있습니다."
자본 배분과 경쟁 포지셔닝
Baseten은 올해 인력을 3배로 늘릴 계획이며, 엔지니어링, 연구, 운영 및 엔터프라이즈 고객 확보 팀에 투자할 예정이다. 회사는 Altimeter, Battery Ventures, Blackbird, Greylock, IVP, Nvidia, Spark Capital, Wellington Management 등 투자자들로부터 현재까지 20억 달러 이상을 조달했다.
경쟁 환경에는 관리형 추론 서비스를 제공하는 클라우드 하이퍼스케일러(Amazon Bedrock, Google Vertex AI, Microsoft Azure AI)와 Together AI, Fireworks AI 같은 전문 추론 제공업체가 있다. Baseten의 차별화 포인트는 멀티 클라우드 독립성과 인기 모델을 위한 공유 추론 용량이 아닌 맞춤형 및 포스트 트레이닝 모델에 대한 집중이다. 이 회사는 공유 엔드포인트의 지연 시간 변동성을 용납할 수 없고 파인튜닝된 모델을 위한 전용 GPU 할당이 필요한 기업들을 타겟으로 한다.
투자자들에게 Baseten의 스토리는 더 광범위한 테제를 반영한다. 파운데이션 모델이 상품화됨에 따라 AI의 지속 가능한 마진은 이를 오케스트레이션하는 인프라 레이어로 이동하고 있다는 것이다. 이전 보도에 따르면 회사의 매출 궤적(단일 분기에 연율 약 2억 달러에서 6억 달러로)은 시장이 이미 이러한 변화를 가격에 반영하고 있음을 시사한다. Baseten의 고객에는 가장 가치 있는 민간 AI 기업들이 포함되어 있으며, 플랫폼은 특화 모델의 확산과 엔터프라이즈의 멀티 클라우드 유연성 필요성이라는 두 가지 구조적 트렌드의 교차점에 위치해 있다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.