중국과 미국 최첨단 AI 모델 간 격차가 수년이 아닌 수개월로 좁혀졌다. Zhipu와 DeepSeek의 오픈웨이트(open-weight) 시스템이 최고 수준의 폐쇄형 모델에 근접한 벤치마크 점수를 기록하면서다.
중국과 미국 최첨단 AI 모델 간 격차가 수년이 아닌 수개월로 좁혀졌다. Zhipu와 DeepSeek의 오픈웨이트(open-weight) 시스템이 최고 수준의 폐쇄형 모델에 근접한 벤치마크 점수를 기록하면서다.

중국과 미국 최첨단 AI 모델 간 격차가 수년이 아닌 수개월로 좁혀졌다. Zhipu와 DeepSeek의 오픈웨이트(open-weight) 시스템이 최고 수준의 폐쇄형 모델에 근접한 벤치마크 점수를 기록하면서다.
일론 머스크는 중국 대규모 언어 모델이 2027년 1분기까지 Anthropic의 Fable과 동등한 수준에 도달할 수 있다고 전망했다. 이는 Zhipu AI의 GLM-5.2가 격차를 좁히고 있다는 소셜 미디어 게시물에 대한 응답이었다. 구글 딥마인드 CEO 데미스 허사비스 역시 중국 국영 매체가 인용한 기존 발언에서 중국 AI 모델이 해외 경쟁사보다 "불과 몇 달 뒤처져 있을 수 있다"고 밝힌 바 있다.
"눈에 띄는 것은 개선 속도입니다."라고 AI 인프라를 추적하는 Edgen의 분석가 레이첼 김이 말했다. "중국 연구소들은 예전에 수년이 걸리던 것을 분기 단위로 압축하고 있으며, 이를 자체 국산 실리콘으로 해내고 있습니다."
Zhipu AI는 6월 16일 MIT 라이선스 하에 GLM-5.2를 출시했으며, 상업적 용도로 무료 사용이 가능하다. 이 모델은 Terminal-Bench 2.1에서 81.0점을 기록했는데, 이는 GLM-5.1의 62.0점에서 단일 포인트 릴리스 만에 31% 상승한 수치다. SWE-bench Pro에서는 62.1점으로 GPT-5.5를 앞질렀으며, FrontierSWE에서는 Anthropic의 Opus 4.8에 단 1점 차이로 뒤쳐졌다. 이 모델은 100만 토큰의 컨텍스트 윈도우를 제공하며, 토큰당 비용은 선도적인 미국 폐쇄형 모델의 약 6분의 1 수준이다.
DeepSeek의 V4-Pro는 토큰당 490억 개의 파라미터를 활성화하는 1.6조 파라미터 전문가 혼합(Mixture-of-Experts) 모델로, SWE-bench Verified에서 80.6%를 기록했다. 출력 토큰 100만 개당 약 87센트로, 최첨단 가격의 약 30분의 1 수준이다. 가중치는 공개되어 있다. 알리바바의 Qwen 제품군은 1월 Hugging Face에서 10억 다운로드를 돌파하며 메타의 Llama를 제치고 전 세계에서 가장 많이 다운로드된 오픈 모델 제품군이 되었다.
세 번의 출시, 4개월
중국 모델 출시의 흐름이 그 속도를 보여준다. GLM-5는 2월에 출시됐다. GLM-5.1은 3월에 이어졌으며, 자체 코딩 점수를 35.4에서 45.3으로 28% 향상시켰다. GLM-5.2는 6월에 출시되어 Terminal-Bench 결과를 다시 거의 두 배로 늘렸다. 각 단계는 중국산 실리콘으로 훈련되었으며, 일부 증거에 따르면 전체 스택이 이제 Nvidia 없이 운영되고 있다.
2023년, 오픈 모델은 폐쇄형 최첨단 모델보다 2년 뒤처져 있었다. 2024년에는 그 격차가 1년으로 줄었다. 2025년에는 6개월이 됐다. 오늘날, 엔지니어링 작업에 중요한 벤치마크에서 격차는 주 단위로 측정된다.
가치가 이동하는 곳
모델 가중치가 상품 수준의 가격에 가까워짐에 따라, 경제성은 추론(Inference)과 인프라로 이동하고 있다. 업계 추정에 따르면, 추론은 이제 전체 AI 컴퓨팅의 약 3분의 2를 소비하며, 이는 2023년 3분의 1에서 증가한 수치다. Nebius Group은 한 고객이 자사 플랫폼에서 오픈 모델을 사용해 추론 비용을 26배 절감했다고 보고했다. Cloudflare는 이제 자사 엣지 네트워크에서 70개 이상의 모델을 서비스한다.
마이크로소프트 CEO 사티아 나델라는 6월 14일 에세이에서 이러한 변화를 설명하며, 기업들이 "인적 자본(human capital)"과 "토큰 자본(token capital)" — 즉 임대가 아닌 자체 소유 AI 역량 — 을 모두 구축해야 한다고 주장했다. 직원들에게 보낸 경고는 비싼 최첨단 모델을 통해 모든 작업을 처리하기보다 더 저렴한 특화 모델을 사용하라는 것이었다.
투자자들에게 이러한 격차 축소는 마이클 버리가 지적한 데이터센터 업계의 잠재적 과소평가된 감가상각비 1760억 달러에 대한 의문을 제기한다. 최첨단 모델이 128GB 통합 메모리를 갖춘 Nvidia의 Grace Blackwell 데스크톱인 4700달러짜리 DGX Spark 데스크톱에서 실행될 수 있다면, 5년 감가상각 일정을 뒷받침하는 중앙집중식 추론 수요 곡선은 스프레드시트가 가정하는 것보다 더 느리게 성장할 수 있다. 2026년 예정된 미국 데이터센터의 약 절반이 이미 지연 또는 취소에 직면해 있으며, 예측 시장은 2027년 이전에 대규모 데이터센터 인센티브에 대한 연방 모라토리엄 가능성을 약 3분의 1로 보고 있다.
본 문서는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.