핵심 요약:
- Anthropic의 클로드 소네트 5, 지식 업무 벤치마크에서 Opus 4.8과 동등한 성능을 60% 낮은 비용으로 제공
- 에이전틱 코딩 벤치마크 점수 63.2%로, 소네트 4.6의 58.1% 대비 상승, Opus 4.8의 69.2%에 근접
- IPO를 앞두고 출시, 연간 매출 실행률 470억 달러, 기업가치 9,650억 달러 기록
핵심 요약:

Anthropic의 새로운 미드티어 모델, 플래그십급 에이전틱 성능을 절반 가격에 제공.
Anthropic은 화요일 미드티어 AI 모델인 클로드 소네트 5(Claude Sonnet 5)를 출시했다. 이 모델은 지식 업무 벤치마크에서 플래그십 모델인 Opus 4.8과 동등한 성능을 보이면서도 토큰당 비용은 60% 낮아, 기업용 AI 시장의 가격 경쟁을 더욱 가속화하고 있다. 회사는 기업공개(IPO)를 앞두고 있다.
"클로드 소네트 5를 사용하면 에이전트가 계획을 유지하고, 규칙을 준수하며, 깔끔한 다단계 변경 사항을 효율적인 비용으로 제공합니다"라고 AI 기반 코드 편집기 Cursor의 공동창업자 Sualeh Asif는 말했다.
소네트 5는 에이전틱 코딩 벤치마크인 SWE-bench Pro에서 63.2%를 기록, 소네트 4.6의 58.1%에서 상승했으며 Opus 4.8의 69.2%에 근접했다. 지식 업무 평가인 GDPval-AA v2에서는 플래그십 모델을 넘어섰다(1,618 대 1,615). 가격은 8월 31일까지 입력 토큰 100만 개당 2달러, 출력 토큰 100만 개당 10달러로 책정됐으며, Opus 4.8은 각각 5달러와 25달러다. 이 모델은 콘텐츠에 따라 입력을 1.0~1.35배까지 확장할 수 있는 업데이트된 토크나이저를 사용하는데, Anthropic은 이 변화가 도입 기간 동안 "대략 비용 중립적"이도록 조정되었다고 밝혔다.
이번 출시는 Anthropic이 올해 후반 예정된 IPO를 위해 6월 1일 S-1을 기밀로 제출한 이후 이루어졌다. 회사는 5월 650억 달러 규모의 시리즈 H 라운드에서 9,650억 달러의 기업가치를 인정받았으며, 연간 매출 실행률 470억 달러를 보고했다. 이에 따라 소네트 등급이 실험적 사용을 생산 규모의 수익으로 전환하는 능력이 공개 시장 투자자들에게 핵심 지표가 될 전망이다.
에이전틱 능력이 새로운 기준선으로 부상
소네트 5가 자율적 작업 실행(계획 수립, 도구 사용, 다단계 워크플로 완료)을 강조하는 것은 AI 업계 전반의 광범위한 변화를 반영한다. OpenAI는 지난주 유사한 하위 에이전트 기능을 갖춘 GPT-5.6 Sol을 프리뷰로 출시했으며, 5월 출시된 구글의 제미니 3.5 플래시(Gemini 3.5 Flash)는 최소한의 인간 입력만 필요한 에이전틱 도구로 소개됐다. 이제 차별화 포인트는 어떤 회사가 에이전틱 모델을 구축할 수 있느냐가 아니라, 생산 배포에 충분히 저렴한 가격으로 제공할 수 있느냐는 것이다.
초기 액세스 파트너들은 소네트 5가 이전 모델들이 멈춰섰던 복잡한 작업을 완료한다고 보고했다. Zapier의 선임 엔지니어 Daniel Shepard는 Salesforce 계정 등급 업데이트와 엔터프라이즈 연락처에 출시 발표를 전송하는 2단계 자동화 작업을 모델이 완료했으며, 이전 버전에서는 "작업이 중간에 멈추곤 했다"고 말했다. 또 다른 코딩 평가인 Terminal-Bench 2.1에서 소네트 5는 80.4%를 기록, 소네트 4.6의 67.0%와 Opus 4.8의 82.7%와 비교됐다.
안전성 트레이드오프와 IPO 내러티브
Anthropic은 소네트 5가 전작보다 할루시네이션(환각) 및 아첨(sycophancy) 비율이 낮고 프롬프트 인젝션 공격에 더 강하다고 밝혔다. 그러나 Mozilla와 함께 제작한 Firefox 147 익스플로잇 개발 평가에서 소네트 5는 13.2%의 부분적 성공률을 보여 소네트 4.6의 8.8%보다 상승했지만, 두 모델 모두 작동하는 익스플로잇을 생성하지는 못했다. Opus 4.8은 68.8%, 제한된 Mythos 5는 88.4%를 기록했다. Anthropic은 Opus 4.7 및 4.8에서와 마찬가지로 소네트 5에 실시간 사이버 보호 기능을 기본 활성화 상태로 출시했다.
이 가격 전략은 Anthropic의 IPO 내러티브에 이중 목적을 제공한다. 회사는 저렴한 모델이 개발자의 실험적 사용뿐만 아니라 수천 개의 기업 고객으로부터 대규모 반복 API 수익을 창출할 수 있음을 입증해야 한다. D.A. Davidson의 기술 연구 책임자 Gil Luria는 CNBC에 Anthropic이 "최첨단 AI 모델에서 선두를 달리고 있는 것으로 보이지만, 현재 사용량의 대부분은 시험 및 실험용이며 이것이 지속 가능하지 않을 수 있다"고 말했다.
바로 어제, 캘리포니아 주지사 개빈 뉴섬은 모든 주 정부 기관에 클로드를 50% 할인된 가격으로 제공하고 무료 인력 교육을 지원하는 파트너십을 발표했다. 이는 반복 수익의 기반이 될 수 있는 지속적이고 제도적인 도입 사례다. Anthropic은 3월 1,220억 달러를 조달하고 8,520억 달러의 기업가치를 인정받아 자체 IPO를 추진 중인 OpenAI, 그리고 구글, 메타, 유사한 기능을 개발 중인 자금력 있는 아시아 AI 스타트업들과 경쟁에 직면해 있다.
Anthropic의 주식은 아직 공개 거래되지 않았다. 회사의 S-1 서류가 공개되면, 소네트 등급(저가이지만 대량)과 Opus 등급(고가이지만 고마진) 중 어느 쪽이 총이익의 대부분을 차지하는지에 대한 면밀한 조사를 받게 될 것이다. PitchBook 애널리스트 Harrison Rolfes가 CNBC에 말했듯이, 2026년 IPO 창은 "닷컴 시대 이후 가장 중요한 IPO 사이클이 되거나, 내러티브와 펀더멘털의 차이에 대해 공개 시장이 가르친 가장 값비싼 교훈이 될 것"이다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.