AI의 가격 역설: 업스트림 하드웨어 비용은 급등하는 반면 다운스트림 토큰 가격은 붕괴하고 있으며, 두 추세 모두 가속화되고 있다.
AI의 가격 역설: 업스트림 하드웨어 비용은 급등하는 반면 다운스트림 토큰 가격은 붕괴하고 있으며, 두 추세 모두 가속화되고 있다.

AI 산업이 보기 드문 구조적 가격 분열을 겪고 있다. 업스트림 하드웨어 비용은 급등하는 반면 다운스트림 토큰 가격은 붕괴하고 있으며, 두 추세 모두 2026년 상반기 들어 가속화되고 있다.
"AI 산업 체인은 구조적 가격 분기 현상을 겪고 있습니다. 업스트림 컴퓨팅 리소스 가격은 공급 주도 인플레이션에 직면한 반면, 다운스트림 토큰 소비 가격은 경쟁적 디플레이션에 직면하고 있습니다."라고 중국머천트증권의 전략가 장샤가 6월 15일 보고서에서 밝혔다.
그 격차는 극명하다. 반도체 식각 핵심 소재인 육불화텅스텐은 1kg당 1,6701,810위안으로 1년 전 523위안 대비 232.7% 급등했다. 한국 공급업체들이 삼성전자와 SK하이닉스에 2026년 계약 가격 인상폭을 7090%로 통보했기 때문이다. 스토리지, CPU, 광모듈도 하이퍼스케일러 자본지출 가속화에 따라 상승 추세를 이어가고 있다. 업계 추정에 따르면 하이퍼스케일러 자본지출은 2025년 4,480억 달러에서 2026년 7,570억 달러, 2027년 9,200억 달러로 증가할 전망이다.
투자자들이 지금 묻는 질문은 이것이다: 급증하는 토큰 소비량이 가격 하락을 상쇄할 만큼 충분해 업계 전체 매출 성장을 유지할 수 있을까?
공급 제약이 업스트림 인플레이션을 주도하다
업스트림 가격 급등은 완화 조짐이 보이지 않는 수급 불일치에 직접 기인한다. 하이퍼스케일러 자본지출은 2022년 1,620억 달러에서 2026년 예상 7,570억 달러로 4배 이상 증가했지만, 업스트림 생산 능력을 가동하는 데는 수년이 걸린다. 삼성전자와 SK하이닉스는 모두 2026년 4~5월 실적 발표에서 AI 기반 메모리 부족 현상이 2027년 이후까지 지속될 것이라며, 핵심 고객들이 이미 2027년 물량을 선점하고 있다고 밝혔다.
2025년 1월 발표된 중국의 2조 위안 데이터 인프라 계획은 또 다른 수요 층을 추가했다. 이 계획은 AI 칩의 최소 80%를 화웨이, 캠브리컨 같은 국내 공급업체로부터 조달하도록 요구하며, 엔비디아와 AMD는 배제한다. 총 투자액 중 약 7,800억 위안(39%)이 GPU 칩에 투입되어 가장 큰 단일 수혜 부문이 될 전망이다. 전력 및 배전 설비는 21%(4,200억 위안)를 차지하며, 광모듈, 스위치, 냉각 장비가 각각 약 4%를 차지한다.
국내 칩 제조사들은 이미 입지를 넓히고 있다. 중국 AI 칩 시장 점유율은 2026년 상반기 52%를 넘어서며 2025년 41%에서 상승, 처음으로 엔비디아를 제쳤다. 화웨이의 어센드 시리즈는 2025년 81만 2,000대가 출하되며 국내 칩 출하량의 거의 절반을 차지했고, 알리바바의 핑터우거가 26만 5,000대, 바이드 쿤룬과 캠브리컨이 각각 약 11만 6,000대를 기록했다.
토큰 디플레이션과 제번스 역설의 만남
다운스트림의 가격 상황은 완전히 다르다. 오픈AI는 앤트로픽의 공격적인 가격 정책에 대응해 상당한 토큰 가격 인하를 고려 중이며, 텐센트 클라우드는 이미 입력 가격을 66.67% 인하했다. 6월 9일 출시된 앤트로픽의 클로드 페이블 5는 복잡한 장문 컨텍스트 작업에서 이전的所有 공개 모델을 능가하면서도, 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러로 전작 미소스 프리뷰의 절반도 안 되는 가격을 책정했다.
시장 전체 토큰 지출을 추적하는 실리콘데이터 LLM 토큰 지출 지수는 기업들이 추가 가격 인하를 예상하며 구매를 연기하면서 2월 이후 처음으로 눈에 띄는 하락세를 보였다.
하지만 총 소비량은 폭발적으로 증가하고 있다. OpenRouter 데이터에 따르면 6월 8일 기준 주간 글로벌 토큰 호출 수는 36조 1,000억 건에 달하며 계속 기하급수적으로 증가하고 있다. 중국의 생성형 AI 사용자는 2024년 말 2억 4,900만 명에서 2025년 중반 5억 1,500만 명으로 약 2배 증가했으며, 같은 기간 일일 토큰 소비량은 약 1,000억 개에서 1조 4,000억 개로 14배 급증했다. 사용자 증가와 소비 증가 간의 격차는 신규 사용자가 아니라 사용자당 더 깊은 참여와 에이전트 기반 애플리케이션의 급속한 보급이 동인임을 시사한다.
이것이 바로 제번스 역설이 작동하는 모습이다: 자원 비용이 하락하면 총수요는 상승하며, 종종 총지출을 증가시킬 만큼 충분히 상승한다. 석탄, 전기, 대역폭에서도 일어난 일이다. 과연 토큰 경제도 같은 패턴을 따를 것인가가 관건이다.
투자 시사점
투자자들에게 이 분기 현상은 두 가지 뚜렷한 거래 기회를 창출한다. 업스트림 하드웨어 공급업체(칩 제조사, 메모리 생산업체, 광모듈 제조사, 전력 장비 공급업체)는 최소 2027년까지 지속될 구조적 공급 제약과 정책 주도 수요의 혜택을 받는다. 엔비디아와 AMD 대신 국산 칩을 우대하는 2조 위안 규모의 중국 인프라 계획은 세계 2위 AI 시장의 경쟁 역학을 재편하는 다년간의 구조적 추세다.
다운스트림은 더 복잡하다. 폭발적으로 증가하는 토큰 볼륨을 포착할 수 있는 기업(글로벌에서 가장 많이 호출되는 모델 중 하나인 딥시크, 텐센트의 훈위안 같은 모델 제공업체)은 규모를 통해 가격 압축을 상쇄할 수 있다. 오픈소스 모델은 이제 전체 토큰 사용량의 거의 3분의 1을 차지하며, 개발자들은 일부 폐쇄형 API를 딥시크와 알리바바의 큐원으로 대체하고 있다.
전력 및 에너지 저장 분야도 간접적 수혜자로 떠오르고 있다. 중국의 AI 데이터센터는 2025년 1,960억 kWh를 소비했으며, 국가에너지국은 이 수치가 2030년까지 8,000억 kWh에 달해 전체 국가 전력 소비량의 약 6%를 차지할 것으로 전망한다. 설치된 에너지 저장 용량은 2025년 말 기준 1억 3,600만kW로 전년 대비 84% 증가했으며, AI 인프라가 중요한 신규 수요 동인이 되고 있다.
핵심 리스크는 다운스트림 토큰 수요 성장이 기하급수적 궤적을 유지할 수 있느냐는 점이다. 제번스 역설이 성립한다면 업계 총매출은 증가한다. 가격 하락이 볼륨 성장을 앞지른다면 애플리케이션 계층의 마진은 지속적인 압박을 받게 된다. 향후 두 분기 동안의 하이퍼스케일러 실적 발표가 첫 번째 실제 시험대가 될 것이다.
본 기사는 정보 제공 목적으로만 제공되며 투자 조언을 구성하지 않습니다.