주요 내용:
- 샤오미, MiMo-V2.5 API 가격 최대 99% 영구 인하
- 입력 캐시 히트 가격, 토큰 100만 개당 RMB0.025로 하락
- 딥시크의 V4-Pro 모델 75% 가격 인하에 이은 조치
주요 내용:

샤오미(Xiaomi Corp.)가 MiMo-V2.5 시리즈 대규모 언어 모델 API 가격을 최대 99% 영구 인하했다. 수요일부터 글로벌 시장에 적용되는 이번 조치는 중국 AI 업체들 간의 가격 전쟁을 더욱 심화시키고 있으며, 이 과정에서 딥시크(DeepSeek)는 이미 자사 플래그십 모델 비용을 75% 인하한 바 있다.
"새로운 가격 정책은 컨텍스트 윈도우 길이에 따른 구분을 없애고, 기업 워크로드에서 AI 추론을 대규모로 경제적으로 이용할 수 있게 한다"고 회사는 성명을 통해 밝혔다. 샤오미는 또한 최적화된 토큰 플랜(Token Plan) 하에 크레딧 기반 결제 시스템을 도입했으며, 추가 요금 없이 사용량이 기존 대비 5~8배까지 증가한다.
MiMo-V2.5 Pro 버전의 입력 캐시 히트 가격은 토큰 100만 개당 RMB0.025로, 기존 대비 99% 인하됐다. 표준 MiMo-V2.5는 토큰 100만 개당 RMB0.02로 98% 낮아졌다. 출력 가격은 Pro 버전이 토큰 100만 개당 RMB6(86% 인하), 표준 버전이 토큰 100만 개당 RMB2(93% 인하)로 조정됐다. 이번 조정은 글로벌 시장에 적용된다.
이번 인하로 샤오미의 추론 가격은 최근 할인을 단행한 딥시크 V4-Pro보다 낮아졌다. 딥시크 V4-Pro는 캐시 히트 입력 기준 토큰 100만 개당 $0.003625를 청구하는데, 이는 샤오미의 RMB0.025와 현재 환율로 거의 동일한 수준이며, 출력은 토큰 100만 개당 최대 $0.87이다. 딥시크는 지난 5월 효율성 개선을 이유로 75% 인하를 영구화했으며, 프로모션 할인이 아니라고 밝혔다. 그레이하운드 리서치(Greyhound Research)의 산치트 비르 고지아(Sanchit Vir Gogia) 수석 애널리스트는 딥시크의 조치에 대해 "할인이 아니라 효율성 개선 효과가 전가된 것"이라고 분석했다.
정부 지원 업계 추정에 따르면, 중국 생성형 AI 시장은 2020년대 말까지 연간 35% 이상 성장할 전망이며, 2026년 초 기준 300개 이상의 등록된 생성형 AI 서비스가 존재한다. 이번 가격 전쟁은 샤오미와 딥시크, 알리바바의 통이첸원(Tongyi Qianwen), 바이두의 어니봇(Ernie Bot), 텐센트의 훈위안(Hunyuan) 모델 간 대결로 이어지고 있으며, 이들 모두 지난 2년간 대규모 언어 모델 서비스를 확장해왔다. 업계 분석가들은 지속적인 가격 인하가 2010년대 중국 인터넷 업계를 재편했던 클라우드 컴퓨팅 가격 전쟁과 유사한 경쟁 구도를 촉발할 수 있다고 진단했다.
추론 비용 하락은 기업들이 AI를 대규모로 도입함에 따라 컴퓨팅 인프라 수요를 증가시킬 수 있다. 중국의 AI 서버 및 데이터센터 시장은 2020년대 말까지 두 자릿수 성장률을 기록할 것으로 전망되며, 이는 미국의 기술 규제로 인해 제한된 기술의 대안을 찾고 있는 화웨이(Huawei)와 중국 서버 제조업체 등 국내 하드웨어 공급업체에 혜택이 될 전망이다. 국제에너지기구(IEA)는 AI 도입 가속화로 인해 글로벌 데이터센터 전력 소비량이 2030년까지 연간 약 1,000테라와트시(TWh)로 두 배 이상 증가할 수 있다고 경고했다.
샤오미의 공격적인 가격 전략은 스마트폰 및 IoT 생태계 전반에서 AI 서비스 채택을 촉진할 수 있지만, 수익성에 미치는 영향은 불분명하다. 샤오미 주식은 수요일 홍콩 시장에서 1.8% 하락했으며, 공매도가 거래량의 29.5%를 차지했다. 회사는 가격 인하가 예상 매출에 미치는 영향이나 현재 MiMo 모델을 사용하는 기업 고객 수를 공개하지 않았다.
본 기사는 정보 제공 목적으로만 작성되었으며, 투자 조언을 구성하지 않습니다.