중국 스타트업 딥시크(DeepSeek)의 새로운 AI 아키텍처가 73% 적은 컴퓨팅 자원으로 100만 토큰 모델을 구동할 수 있다고 예고하며, 현 AI 하드웨어 시장의 비용 구조를 직접적으로 위협하고 나섰습니다.
뒤로
중국 스타트업 딥시크(DeepSeek)의 새로운 AI 아키텍처가 73% 적은 컴퓨팅 자원으로 100만 토큰 모델을 구동할 수 있다고 예고하며, 현 AI 하드웨어 시장의 비용 구조를 직접적으로 위협하고 나섰습니다.

중국 스타트업 딥시크(DeepSeek)의 새로운 AI 아키텍처가 73% 적은 컴퓨팅 자원으로 100만 토큰 모델을 구동할 수 있다고 예고하며, 현 AI 하드웨어 시장의 비용 구조를 직접적으로 위협하고 나섰습니다. 이 회사는 자사의 새로운 V4 모델이 이전 모델 대비 27%의 컴퓨팅 파워와 10%의 메모리만으로 100만 토큰 컨텍스트를 처리할 수 있다고 주장합니다. 이러한 구조적 변화는 개발자들의 비용을 크게 낮추고 엔비디아(Nvidia) 및 구글(Google)과 같은 기존 업체들과의 경쟁을 심화시킬 수 있습니다.
딥시크는 공식 발표를 통해 "이제부터 100만 컨텍스트는 딥시크의 모든 공식 서비스에서 표준 사양이 될 것"이라고 밝혔습니다. 이는 엔비디아의 CEO 젠슨 황(Jensen Huang)이 중대한 장벽으로 지적했던 대규모 컨텍스트 AI와 관련된 높은 비용 문제에 대한 직접적인 도전입니다. 딥시크의 벤치마크 결과가 일반 지식 측면에서는 여전히 구글의 최첨단 폐쇄형 모델에 뒤처지는 것으로 나타났지만, 효율성 개선 측면에서는 AI 군비 경쟁에서 강력한 새로운 위협이 되고 있습니다.
V4 모델의 효율성은 새로운 하이브리드 어텐션 아키텍처에서 비롯됩니다. 100만 토큰 컨텍스트에서 단일 토큰 추론에 필요한 초당 부동 소수점 연산(FLOPs)을 이전 V3.2 모델의 27% 수준으로 줄였습니다. 메모리의 주요 병목 현상인 KV 캐시 요구량은 이전 버전의 10%로 감소했습니다. 회사는 두 가지 버전을 출시했습니다. 1.6조 개의 파라미터를 가진 V4-Pro 모델과 더 작은 V4-Flash 모델이며, 두 모델 모두 오픈 소스 MIT 라이선스로 제공됩니다.
투자자들에게 딥시크의 이번 돌파구는 현재 시장에 대한 잠재적인 혼란을 의미합니다. 무차별적인 컴퓨팅 파워에 덜 의존하는 모델을 설계함으로써, 화웨이의 어센드(Ascend) 칩과 같은 대안 하드웨어의 입지를 넓혀주고 있습니다. 이는 중국이 독자적인 AI 스택을 구축하고 있다는 엔비디아 CEO의 경고와 일맥상통합니다. 알리바바와 텐센트의 지원을 받으며 200억 달러 이상의 기업 가치를 노리는 것으로 알려진 딥시크는 비용 우위가 확장성을 증명하고 널리 채택될 경우, 클라우드 제공업체와 칩 제조업체의 마진을 압박할 수 있습니다.
딥시크 V4의 핵심 혁신은 트랜스포머 모델의 연산 핵심인 어텐션 메커니즘을 재설계하는 두 갈래 접근 방식입니다. 표준 어텐션은 시퀀스의 모든 토큰이 다른 모든 토큰과 관련성 점수를 계산해야 하므로 연산 복잡도가 제곱으로 증가하며, 이는 100만 토큰 컨텍스트 윈도우 상용화의 주요 장벽이었습니다.
딥시크의 솔루션은 압축 희소 어텐션(CSA)과 고압축 어텐션(HCA)을 결합한 것입니다. CSA는 훈련 가능한 메커니즘을 사용하여 어떤 토큰 연결이 전체 계산을 수행할 만큼 중요한지 학습하며, 모든 것을 계산하는 대신 동적으로 희소 구조를 생성합니다. HCA는 추론 중에 고가의 GPU 메모리에 유지되어야 하는 데이터인 KV 캐시를 압축하여 메모리 문제를 해결합니다. 이러한 혁신을 통해 딥시크는 기존 아키텍처 대비 동일한 하드웨어에서 3~4배 더 많은 동시 사용자를 수용할 수 있습니다.
딥시크 V4-Pro의 효율성이 주요 특징이지만, 성능 벤치마크는 특정 분야에 특화된 경쟁자로서의 면모를 보여줍니다. 이 모델은 수학과 코딩에서 뛰어나 코드포스(Codeforces) 벤치마크에서 3206점을 기록하며 오픈AI와 구글 모델의 공식 점수를 앞질렀습니다. 그러나 일반적인 세계 지식과 고난도 추론 테스트에서는 뒤처집니다. SimpleQA-Verified 벤치마크에서 V4는 57.9점을 기록하여 구글 제미나이 3.1 프로의 75.6점에 크게 미치지 못했습니다.
이는 딥시크가 모든 전선에서 프론티어 모델을 이기려 하기보다는, 명확한 우위를 점할 수 있는 특정 고부가가치 역량에 자원을 집중하고 있음을 시사합니다. 오픈 소스 및 저비용 접근 방식과 결합된 이러한 전략은 출시 첫 주 만에 애플 앱스토어 다운로드 차트 1위를 차지하는 성과를 거두었으며, 이는 미국 빅테크 기업의 값비싼 폐쇄형 모델에 대한 대안을 찾는 시장의 강력한 수요를 방증합니다. 비미국산 하드웨어에 최적화된 강력하고 비용 효율적인 모델의 등장은 엔비디아의 젠슨 황이 "국가적으로 끔찍한 결과"라고 묘사했던 시나리오이며, 이는 많은 이들의 예상보다 빠르게 전개되고 있는 것으로 보입니다. 투자자들에게 핵심 질문은 이러한 아키텍처적 이점이 얼마나 빨리 시장 점유율과 수익으로 전환될 것인지, 그리고 엔비디아와 같은 기존 업체들이 더 효율적이고 다극화된 AI 하드웨어 세계의 위협에 대응하기 위해 자체 로드맵을 조정할 수 있는지 여부입니다.
이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.