AI 모델 API를 위한 새로운 중간 시장이 등장하고 있으며, 중국의 일일 토큰 호출량이 1,000배 급증하여 140조 개를 넘어섬에 따라 인공지능의 '도매에서 소매'로 이어지는 네트워크가 구축되고 있습니다.
AI 모델 API를 위한 새로운 중간 시장이 등장하고 있으며, 중국의 일일 토큰 호출량이 1,000배 급증하여 140조 개를 넘어섬에 따라 인공지능의 '도매에서 소매'로 이어지는 네트워크가 구축되고 있습니다.

AI 모델 API를 위한 새로운 중간 시장이 등장하고 있으며, 중국의 일일 토큰 호출량이 1,000배 급증하여 140조 개를 넘어섬에 따라 인공지능의 '도매에서 소매'로 이어지는 네트워크가 구축되고 있습니다.
인공지능의 상업화는 기계 지능의 기본 단위가 상품처럼 구매, 라우팅 및 재판매되는 배포 계층이라는 새로운 중개인 계층을 형성하고 있습니다. 이러한 '토큰노믹스(tokenomics)' 시장은 중국의 일일 AI 모델 API 호출량이 2024년 초 1,000억 개에서 2026년 3월까지 140조 개 이상으로 1,000배 이상 폭발적으로 증가한 것에 의해 주도되고 있습니다(화원증권 보고서 기준). 이 새로운 계층은 바이트댄스, 알리바바와 같은 상류 모델 제작자와 파편화된 하류 개발자 및 기업을 연결하여 글로벌 AI 토큰 흐름을 위한 유동성 인프라를 구축합니다.
화원증권의 첸리앙동 애널리스트는 보고서에서 "토큰 운영은 상류의 거대 모델 제조사와 하류의 개발자, 기업, 개인을 연결하는 토큰 배포 모델을 탐색하며 새로운 중간층 시장을 형성하고 있습니다. 이는 본질적으로 토큰의 글로벌 도매-소매 네트워크를 위한 유동성 인프라입니다"라고 밝혔습니다.
이러한 성장은 막대한 AI 소비 규모와 중국 모델의 경쟁력 상승에 힘입은 것입니다. 2026년 1분기, 인기 라우팅 플랫폼인 오픈라우터(OpenRouter)에서 중국 모델의 주간 호출량이 처음으로 미국 모델을 앞질렀습니다. 2월 16일부터 22일 사이, 호출량 기준 상위 5개 모델 중 4개가 중국 모델이었으며, 전체 호출량의 85.7%를 차지했습니다. 2025년 10월 이후 연간 매출이 5배 증가하여 5,000만 달러를 넘어선 오픈라우터와 중국 내 실리콘 모빌리티(Silicon Mobility, 硅基流动)와 같은 플랫폼들이 이 거래의 핵심 인프라를 구축하며, 개발자가 하나의 키로 수백 개의 모델에 액세스할 수 있는 통합 API를 제공하고 있습니다.
이 새로운 토큰 경제는 클라우드 컴퓨팅에서 암호화폐 결제에 이르기까지 인프라와 배포가 궁극적으로 막대한 가치를 점유하는 다른 기술 스택의 진화 과정을 반영합니다. AI 경쟁이 자본 집약적인 모델 학습에서 수십억 명의 사용자를 위해 모델을 실행하는 운영 과제(추론이라고 함)로 이동함에 따라, 새로운 경쟁 우위는 '답변당 비용'이 되고 있습니다. 미니맥스(MiniMax)의 M2.5와 같은 중국 모델의 입력 비용은 100만 토큰당 0.30달러인 반면, 클로드(Claude) 4.6과 같은 모델은 5달러입니다. 워크로드를 효율적으로 라우팅하려는 경제적 유인은 이러한 새로운 AI 중개업체들에게 수십억 달러 규모의 기회를 제공하고 있습니다.
토큰 배포 사업은 단순히 API 액세스를 마진을 붙여 재판매하는 것 이상입니다. 오픈라우터의 5.5% 프리미엄과 같은 기본 재판매 마진이 기초적인 비즈니스 모델을 제공하지만, 진정한 가치는 스택의 더 높은 곳에서 생성됩니다. 가장 정교한 업체들은 모델 실행 비용을 낮추기 위해 독자적인 추론 가속 엔진을 개발하고 있습니다. 예를 들어, 실리콘 모빌리티는 자사의 SiliconLLM 및 OneDiff 기술이 언어 모델 추론 속도를 10배 향상시켜 업계 표준 비용의 10분의 1 수준으로 API 호출을 제공할 수 있다고 주장합니다.
골드만삭스 연구에 따르면, 업계가 현재의 AI 도구보다 에너지 집약도가 60~130배 높을 수 있는 자율형 시스템인 '에이전틱 AI(agentic AI)'로 이동함에 따라 추론의 단위 경제성에 대한 집중은 매우 중요해졌습니다. 기업 워크플로에서 스마트 기기 관리에 이르기까지 다양한 작업을 처리할 이러한 에이전트들은 지속적이고 유틸리티와 같은 AI 토큰 소비를 유도할 것입니다. 이러한 소비를 안정적이고 저렴하게 라우팅, 측정 및 청구할 수 있는 플랫폼은 AI 경제의 필수 유틸리티로 자리매김하고 있습니다. 이는 서클(Circle)과 코인베이스(Coinbase)와 같은 기업들이 단순히 스테이블코인 발행뿐만 아니라 그 흐름을 제어하는 결제 및 정산 레일(Arc, Base 등)을 구축하기 위해 경쟁하는 암호화폐 인프라 전쟁과 유사합니다.
투자자들에게 이 토큰 배포 계층의 등장은 단순히 유명 모델 개발사를 지원하는 것 이상의 새로운 길을 열어줍니다. 화원 보고서는 두 가지 주요 투자 테마를 제시합니다. 첫째는 알리바바, 텐센트, 바이트댄스와 같이 우수한 모델 역량을 갖춘 기업을 지원하는 것이고, 둘째는 마케팅, 게임, 전자상거래 분야에서 강력한 고객 관계와 높은 소비 시나리오를 가진 기업을 지원하는 것입니다. 요도(yodo, 易点天下)와 블루포커스(BlueFocus, 蓝色光标)와 같은 기업들은 토큰 기반 AI 서비스를 기존 고객 워크플로에 직접 통합할 수 있는 잠재력으로 주목받고 있습니다.
그러나 이 모델에는 위험도 따릅니다. 기본 API 재판매의 기술적 진입 장벽이 낮아 경쟁이 치열해지고 마진이 압박받을 수 있습니다. 또한 배포업체는 모델 제공업체로부터 용량을 선구매하는 동시에 하류 고객에게는 유연한 결제 조건을 제공해야 하므로 상당한 자본 압박과 부실 채권 노출 위험에 직면합니다. 가장 큰 위험은 가격 책정과 액세스 권한을 제어하는 상류 모델 제공업체에 대한 의존도입니다. 주요 제공업체의 갑작스러운 정책 변화는 배포업체의 비즈니스를 즉각적으로 위협할 수 있어, 이 부문은 고성장 분야인 동시에 변동성이 큰 AI 가치 사슬의 한 부분이 되고 있습니다.
이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.