OpenAI의 GPT-5.5, 12시간 소요 보안 퍼즐을 10분 만에 해결

새로운 정부 보고서에 따르면, OpenAI의 새로운 GPT-5.5 모델은 인간 전문가를 훨씬 능가하는 속도로 복잡한 다단계 사이버 공격을 자율적으로 실행하고 복잡한 보안 과제를 해결할 수 있습니다. 영국 AI 보안 연구소(AISI)의 이번 조사 결과는 GPT-5.5의 공격 능력을 앤스로픽의 클로드 미토스(Claude Mythos)와 대등한 수준으로 평가하며, AI의 악용 가능성이 급격하고 광범위하게 발전하는 것이 고립된 돌파구가 아닌 일반적인 추세임을 시사합니다.

영국 과학혁신기술부 산하 연구 기관인 AI 보안 연구소는 보고서에서 "공격적인 사이버 기술이 추론, 코딩 및 자율 작업 완료 능력의 광범위한 개선의 부산물로 나타나고 있다면, 추가적인 발전이 빠르게 잇따를 수 있다"고 경고했습니다.

보고서는 GPT-5.5가 10번의 시도 중 2번이나 32단계의 시뮬레이션된 기업 네트워크 공격을 자율적으로 완료한 과정을 상세히 설명했습니다. SpecterOps가 설계하고 'The Last Ones'라 명명된 이 테스트는 이전까지 앤스로픽의 클로드 미토스 프리뷰(10번 중 3번 성공)만이 완료한 바 있습니다. 더 놀라운 테스트에서 GPT-5.5는 인간 전문가가 12시간 걸리는 역공학(reverse-engineering) 퍼즐을 단 10분 22초 만에 해결했으며, API 사용 비용은 1.73달러에 불과했습니다. 광범위한 전문가 수준 사이버 보안 과제에서 GPT-5.5는 71.4%의 합격률을 기록하여 미토스 프리뷰의 68.6%를 약간 앞섰으며, GPT-5.4의 52.4%를 훨씬 상회했습니다.

이러한 공격 능력의 도약은 시장에 양면적인 충격을 줍니다. 보안 태세가 취약한 기업에게는 심각한 취약성을 노출시켜 비관적인 전망을 형성하는 한편, 사이버 보안 섹터에는 강력한 강세 촉매제로 작용합니다. 이러한 발전은 AI 기반 방어 솔루션에 대한 수요 급증을 유발하고 AI 개발자에 대한 규제 압력을 강화할 것으로 예상되며, 영국 정부가 보고서와 함께 9,000만 파운드의 새로운 사이버 복원력 자금 지원을 발표한 것도 이러한 시장 역학을 강조합니다.

공방 불균형의 확대

AISI의 조사 결과는 이미 구조적으로 편중된 군비 경쟁을 겪고 있는 시장 상황에서 나왔습니다. 바이낸스(Binance)의 연구에 따르면 현재 AI 도구는 스마트 계약 취약점을 탐지하는 것보다 악용하는 데 두 배 더 효과적입니다. 바이낸스 보고서는 GPT-5.3-Codex가 EVMbench 벤치마크의 '익스플로잇(exploit)' 모드에서 72.2%의 성공률을 기록한 반면, '탐지(detect)' 모드에서는 그 절반 수준에 그쳤다고 언급했습니다.

이러한 비대칭성은 공격 비용의 급감에 의해 주도됩니다. 바이낸스 리서치에 따르면 AI 기반 익스플로잇 비용은 현재 계약당 평균 약 1.22달러이며, 이 수치는 두 달마다 22%씩 더 감소할 것으로 예상됩니다. 현재 개발자의 80% 이상이 워크플로우에 AI를 사용하고 있지만 고급 보안 테스트에 사용하는 비율은 40% 미만이어서 자동화된 위협이 파고들 상당한 격차가 존재합니다. 이 추세는 코드에 국한되지 않습니다. TRM Labs 분석가들은 북한 해킹 그룹이 단순한 공격 벡터에 의존하던 전통적인 방식에서 벗어나 정교한 사회 공학적 공격에 AI를 사용하고 있다고 추측합니다.

AI 리스크에 대해 엇갈리는 시장

이러한 능력의 급격한 등장은 책임 있는 공개와 마케팅에 대한 논쟁을 불러일으켰습니다. 샘 올트먼 OpenAI CEO는 최근 보안 솔루션을 판매하기 위해 자사 모델의 위험성을 과대광고하는 경쟁업체들을 겨냥해 '공포 기반 마케팅'이라고 비판했습니다. 올트먼은 최근 팟캐스트 인터뷰에서 "'우리는 폭탄을 만들었습니다. 당신의 머리 위에 떨어뜨릴 것입니다. 하지만 1억 달러에 방공호를 팔겠습니다'라고 말하는 것은 분명히 놀라운 마케팅입니다"라고 말했습니다.

증가하는 위협에 대응하여 OpenAI와 앤스로픽 모두 가장 강력한 모델에 대한 액세스를 제한하고 있습니다. 앤스로픽은 미토스 프리뷰의 초기 출시를 '주요 산업 파트너'로 제한했고, OpenAI는 검증된 '주요 사이버 방어자' 명단에 특화 버전인 GPT-5.5-Cyber를 배포하고 있습니다. 이러한 신중한 접근은 연구원들이 공용 GPT-5.5 모델에서 보안 가드레일을 우회하는 '유니버설 탈옥(universal jailbreak)'을 발견한 것과 맥을 같이 합니다. 레드팀이 이 공격을 개발하는 데는 6시간이 걸렸습니다. OpenAI가 이후 패치를 발행했지만, 이 사건은 오용의 지속적인 위험을 부각시켰으며, 이는 지난 한 해 동안 영국 기업의 43%가 사이버 침해를 보고했다는 점에서 투자자들의 우려 사항이 되고 있습니다.

이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.