센스타임의 새로운 센스노바 U1 모델은 거의 모든 주요 이미지 생성 시스템에서 사용되는 핵심 VAE 구성 요소를 제거했으며, 이는 비용 절감과 시각적 아티팩트 감소를 가능하게 하는 근본적인 아키텍처 변화입니다.
뒤로
센스타임의 새로운 센스노바 U1 모델은 거의 모든 주요 이미지 생성 시스템에서 사용되는 핵심 VAE 구성 요소를 제거했으며, 이는 비용 절감과 시각적 아티팩트 감소를 가능하게 하는 근본적인 아키텍처 변화입니다.

센스노바 U1(SenseNova U1)의 출시와 함께 중국 AI 기업 센스타임(00020.HK)은 대부분의 현대 이미지 생성 모델의 기초 아키텍처에 도전장을 내밀고 있습니다. 이 회사는 20억 파라미터 규모의 모델 프리뷰를 오픈 소스로 공개했는데, 이는 픽셀에서 직접 작동하며 스테이블 디퓨전(Stable Diffusion)부터 구글의 플럭스(Flux)에 이르기까지 거의 모든 시스템에서 사용하는 변분 오토인코더(VAE)를 제거한 NEO-Unify 아키텍처를 기반으로 합니다. 이러한 접근 방식은 VAE의 압축 단계를 거치지 않음으로써 추론 오버헤드를 크게 줄이고 이미지 충실도를 향상시킬 수 있습니다.
센스타임의 쉬리(Xu Li) 회장은 지난 2026년 3월 "향후 AI 제품에 대해 토큰 소비량이 아닌 문제 해결 결과에 따라 비용을 청구할 계획"이라고 밝힌 바 있으며, 이는 보다 효율적인 아키텍처의 비용 절감 잠재력과 궤를 같이하는 철학입니다.
모델 카드에 따르면, 이 20억 프리뷰 모델은 이미지 재구성에서 31.56의 피크 신호 대 잡음비(PSNR)를 달성했습니다. 이는 별도의 VAE 없이도 훨씬 더 큰 플럭스 모델의 32.65 PSNR에 근접한 수치입니다. 이 모델은 난양공과대학교 S-Lab과 공동 개발되었으며 4월 26일 허깅 페이스(Hugging Face)에 공개되었습니다. 80억 파라미터 기반 모델의 출시도 확정되었습니다.
개발자와 기업 사용자들에게 이번 출시는 더 단순하고 효율적인 AI 스택으로의 이동을 의미합니다. VAE를 제거하면 시각적 아티팩트의 주요 원인이 사라지고 상당한 튜닝이 필요한 구성 요소가 제거됩니다. 이는 고품질 이미지 생성 파이프라인 구축의 진입 장벽을 낮추고 운영 시스템의 비용을 절감하여, 미드저니(Midjourney)나 오픈AI(OpenAI)와 같은 서구 벤더들의 API 기반 비즈니스 모델을 직접적으로 위협할 수 있습니다.
변분 오토인코더는 오랫동안 근본적인 필수 요소가 아닌 실무적인 필요에 의해 사용되어 왔습니다. 고해상도 이미지를 디퓨전 프로세스가 발생하는 작고 계산적으로 관리 가능한 잠재 공간으로 압축합니다. 그러나 이 압축은 손실이 발생하여 세부 사항을 버리고 아티팩트를 유발하며, 개발자들은 이를 해결하기 위해 상당한 엔지니어링 시간을 소비합니다. 센스노바의 NEO-Unify 아키텍처는 이 단계를 완전히 우회합니다.
시각 데이터와 언어 데이터를 처음부터 깊게 연관된 것으로 처리함으로써, 모델은 픽셀에서 직접 생성하는 법을 배웁니다. 2단계 학습 전략을 통해 모델은 사전 학습된 거대 언어 모델의 언어 추론 능력을 통합하는 동시에 시각적 인식을 처음부터 구축할 수 있습니다. 이해와 생성을 위한 이 통합 경로는 한 도메인의 이득이 다른 도메인의 성능을 저하시키는 등 기존 멀티모달 모델 학습을 괴롭혔던 성능 트레이드오프를 방지합니다.
센스노바 U1은 딥시크(DeepSeek), 알리바바의 큐원(Qwen), InternVL 프로젝트 등과 함께 중국에서 등장하고 있는 경쟁력 있는 오픈 웨이트 모델 시리즈 중 최신작입니다. 이러한 신속한 아키텍처 실험과 오픈 소스 공개의 결합은 오픈AI, 구글, 앤스로픽의 폐쇄형 미국 중심 모델이나 메타와 같은 서구 기업의 오픈 웨이트 모델에 대한 의미 있는 대안이 되는 강력한 개발자 생태계를 구축하고 있습니다.
특히 데이터 주권과 로컬 인프라가 핵심인 시장의 기업 구매자들에게 이러한 모델은 점점 더 실행 가능한 선택지가 되고 있습니다. 센스타임은 이미 국내 칩 공급업체와의 통합을 심화해 왔으며, 이는 엔비디아의 GPU 공급망에 영향을 미치는 미국의 수출 규제로부터 개발 파이프라인을 보호하는 조치입니다. 아키텍처 혁신, 오픈 소스 전략, 공급망 회복탄력성의 결합은 분절화되는 글로벌 시장에서 중국 AI 부문의 입지를 강화하고 있습니다.
이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.