AI 안전 스타트업 화이트 서클(White Circle), 업계 리더들로부터 1,100만 달러 투자 유치

(P1) 프랑스의 사이버 보안 스타트업 화이트 서클(White Circle)이 대규모 언어 모델을 도입하는 기업들을 위한 새로운 보안 계층인 AI 제어 플랫폼을 확장하기 위해 1,100만 달러의 시드 라운드 투자를 유치했습니다. 이번 투자는 기업들이 데이터 유출, 환각 현상, 프롬프트 주입 공격 등 모델 제공업체가 구축한 일반적인 안전 필터를 넘어서는 리스크에 직면한 가운데 이루어졌습니다.

(P2) 화이트 서클의 설립자이자 CEO인 데니스 실로프(Denis Shilov)는 포춘(Fortune)과의 인터뷰에서 "탈옥(Jailbreak)은 문제의 일부일 뿐입니다. 사람들이 부적절하게 행동할 수 있는 만큼 모델도 부적절하게 행동할 수 있습니다. 우리는 실제로 행동을 강제하고 있습니다"라고 말했습니다.

(P3) 이번 투자 라운드에는 AI 업계 리더들이 대거 참여하여 회사의 접근 방식에 대한 강력한 신뢰를 보여주었습니다. 투자자로는 OpenAI의 개발자 경험 책임자인 로맹 후에(Romain Huet), Anthropic의 더크 킹마(Durk Kingma), Mistral의 공동 설립자인 기욤 람플(Guillaume Lample), Hugging Face의 공동 설립자인 토마스 울프(Thomas Wolf) 등이 포함되었습니다. 회사는 이 자금을 신규 인재 채용, 제품 개발 가속화, 미국, 영국 및 유럽 전역의 고객 기반 확대에 사용할 예정입니다.

(P4) 기업들이 단순한 챗봇에서 파일에 액세스하거나 환불을 실행하는 등의 작업을 수행할 수 있는 자율형 AI 에이전트로 이동함에 따라 전용 제어 계층의 필요성이 더욱 시급해지고 있습니다. 화이트 서클의 플랫폼은 기업의 사용자와 AI 모델 사이에 위치하여 모든 입출력을 실시간으로 모니터링하고 맞춤형 정책을 실행합니다. 이는 모델 제공업체들 스스로가 완벽하게 처리하기에는 이해관계가 얽혀 있는 기능입니다.

파리에 기반을 둔 이 스타트업은 2024년 말 실로프의 연구에서 탄생했습니다. 당시 그는 모든 주요 AI 모델의 안전 가드레일을 우회할 수 있는 보편적인 탈옥 프롬프트를 개발했습니다. 그의 연구 결과가 X(구 트위터)에서 화제가 된 후, Anthropic과 같은 주요 AI 연구소들이 그를 초청하여 모델 테스트를 요청했고, 이를 통해 그는 기업들에게 더 나은 모델뿐만 아니라 더 나은 제어 장치가 필요하다는 것을 확신하게 되었습니다.

화이트 서클의 소프트웨어는 광범위한 모델의 오작동을 포착하도록 설계되었습니다. 사용자의 악성코드 생성 시도를 차단하거나, 모델이 환각 현상을 일으켜 고객에게 승인되지 않은 환불을 약속할 때 플래그를 표시하거나, AI 에이전트가 민감한 재무 데이터를 유출하는 것을 막을 수 있습니다. 이 플랫폼은 이미 10억 건 이상의 API 요청을 처리했으며, 스타트업 러버블(Lovable)과 여러 핀테크 및 법률 회사에서 사용 중이지만 구체적인 매출 수치는 공개되지 않았습니다.

독립적인 중재자로서의 신뢰성을 높이기 위해 화이트 서클의 연구 부문은 OpenAI, Google, xAI 등 벤더들의 15개 AI 모델을 대상으로 100만 건 이상의 실험을 수행한 연구 보고서 'KillBench'를 발표했습니다. 이 연구는 고위험 시나리오에서 나타나는 숨겨진 편향성을 드러내어 일반적인 사용 환경에서는 나타나지 않는 리스크를 강조했습니다.

이번 투자는 AI 섹터 주변에서 성장하는 '곡괭이와 삽' 경제에 대한 강력한 베팅입니다. OpenAI, Anthropic, Mistral과 같은 경쟁 관계에 있는 AI 연구소 임원들의 참여는 제3자 강제 계층이 기업용 AI 스택의 필수 구성 요소라는 광범위한 공감대를 시사합니다. 이는 AI 인프라 및 안전에 집중하는 투자자들에게 있어 새롭고 중요한 시장 카테고리의 등장을 의미합니다.

이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.