Anthropic、Mythos級AI「Fable 5」を公開、サイバーセキュリティ関連クエリはOpus 4.8に自動ダウングレード

AnthropicのClaude Fable 5はMythos級の知能を一般ユーザーに提供するが、サイバーセキュリティ関連のクエリは自動的に性能の低いモデルにダウングレードされる。

Anthropicは、Mythos級AIモデル「Claude Fable 5」をリリースした。同モデルは、サイバーセキュリティおよび生物学研究に関するクエリを従来のOpus 4.8システムにダウングレードする機能を備えており、同社が最も強力なテクノロジーを広く一般に提供するのは今回が初めてとなる。

「当社は、一般ユーザーに対しても安全な方法でこのレベルの知能を提供したいと考えていました」と、Anthropicの製品管理・研究・ラボ責任者であるDianne Penn氏はウォール・ストリート・ジャーナルに語った。

Fable 5の価格は、入力トークン100万トークンあたり10ドル、出力トークン100万トークンあたり50ドルで、Claude Mythos Previewの半額以下である。このモデルは、ソフトウェアエンジニアリング、ビジョン、ナレッジワークの各ベンチマークにおいて、過去のすべてのClaudeシステムを上回る性能を発揮する。StripeはFable 5を活用し、5000万行のRubyリポジトリにおけるコードベース全体の移行を1日で完了。同社はこの作業に手作業で2カ月以上のエンジニアリング工数が必要だったと試算している。

今回のリリースは、Anthropicが自社のセーフティ・クラシファイアがフロンティアAIを商業化するのに十分な堅牢性を持ち、かつユーザーを最も危険な能力にさらすことなく提供できると確信していることを示している。しかし、初期のテストでは、このセーフガードが公示されている範囲よりも広範囲に及ぶ可能性があり、主要な顧客層であるサイバーセキュリティ専門家にとってモデルの有用性が制限される恐れがある。

セーフガードの仕組み

Fable 5は、サイバーセキュリティ、生物学、化学、モデル蒸留に関連するリクエストを検出するAI駆動型のクラシファイアを採用している。トリガーが作動すると、システムはクエリをFable 5ではなくClaude Opus 4.8にルーティングする。Anthropicによると、このフォールバックが発生するセッションは5%未満であり、通常の使用ではほとんどのユーザーがフルスペックのMythos級モデルを利用できるという。

同社は、このセーフガードを意図的に保守的に設計し、利便性よりも安全性を優先していると説明している。Anthropicは外部バグ報奨金プログラムを実施し、1,000時間以上のテストでユニバーサル・ジェイルブレイクは一件も発生しなかったが、英国AISIは短期間の初期テスト期間内に1件の突破口に近づいた。

SANS Instituteの最高AI責任者兼研究責任者であるRob T. Lee氏はCSOに対し、インシデント対応、検知、基本的なフォレンジック・ワークフローを含む日常的なサイバーセキュリティ業務が、初期テスト中にFable 5からOpus 4.8へ自動的にルーティングされたと述べた。この観察結果がより広範なテストでも確認されれば、Anthropicのクラシファイアが良性と悪性の活動を区別するのではなく、サイバーセキュリティ関連のリクエストを広く識別している可能性を示唆することになる。

サイバーディフェンダーのためのMythos 5

厳選されたユーザー群向けに、Anthropicは「Claude Mythos 5」もリリースしている。これはFable 5と同一の基盤モデルだが、サイバーセキュリティのセーフガードが取り除かれている。Project Glasswingを通じて、VerizonやMicrosoftを含む約200の組織が無制限版にアクセスできるようになる。Anthropicは、米国政府と協議の上で開発した、より広範な信頼アクセスプログラムを通じて、段階的にアクセスを拡大する計画だ。

同社によると、Mythos 5は現在利用可能なあらゆるモデルの中で最も強力なサイバーセキュリティ能力を備えており、ソフトウェアの脆弱性の発見、エクスプロイト開発の支援、複雑な多段階サイバーセキュリティタスクの実行が可能である。これらの機能こそが、Anthropicが初期バージョンのテクノロジーへのアクセスを制限する理由でもあった。

セキュリティリーダーにとっての意味

CISOやセキュリティチームにとって、今回の発表は、組織がますます高性能化するAIシステムにいかに迅速に適応できるかという課題を提起する。もはや単に高度なモデルへのアクセスを確保するだけでなく、測定可能な利益をもたらす方法でセキュリティ運用に統合することが求められている。

Ciscoの上級副社長兼最高セキュリティ・トラスト責任者であるAnthony Grieco氏は、組織は強固なセキュリティの基本を維持しながら、強力なモデルを効果的に導入することに注力すべきだと述べた。「フロンティアAI開発のペースは、セキュリティ環境をリアルタイムで変化させており、ディフェンダーは状況が落ち着くのを待っている余裕はありません」とGrieco氏は声明で述べた。

同時にGrieco氏は、AIを基本的なセキュリティ慣行の代替と見なすことに対して警告を発した。「AIはディフェンダーができることの天井を引き上げますが、セキュリティ・レジリエンスこそが、その利益を実際の保護に転換できるかどうかを決定する基盤であり続けます」と述べた。AIモデルがソフトウェアエンジニアリング、分析、セキュリティ運用を加速させるとしても、組織はパッチ適用、多要素認証、ネットワークセグメンテーション、ゼロトラストアーキテクチャといった基本を実行する必要がある。

Anthropicの株式は公開市場では取引されておらず、直接的な市場影響はない。しかし、今回のリリースにより、 rivalであるOpenAIやGoogleは、同等の安全性基準を維持しながらMythos級の能力に追随するよう圧力を受けている。OpenAIは月曜日に自社の機密S-1提出を発表し、Elon MuskのxAIを含むSpaceXは今週、Nasdaqでの取引を開始する予定である。

本記事は情報提供のみを目的としており、投資助言を構成するものではありません。