AIシステムは、人間の関与なしに自らの後継機を設計・構築する能力に近づいているとAnthropicが指摘し、技術が社会の管理能力を超える前に協調的な安全策を求めた。
AIシステムは、人間の関与なしに自らの後継機を設計・構築する能力に近づいているとAnthropicが指摘し、技術が社会の管理能力を超える前に協調的な安全策を求めた。

AIシステムは、人間の関与なしに自らの後継機を設計・構築する能力に近づいているとAnthropicが指摘し、技術が社会の管理能力を超える前に協調的な安全策を求めた。
Anthropicは、AI開発が予想以上に加速していると警告した。同社のClaudeモデルは現在、自社のプロダクションコードベースにマージされたコードの80%以上を作成しており、これはAIシステムが自律的に自らを進化させる再帰的自己改善に向けたマイルストーンであるとしている。
「我々は常に、この概念を社会化し、基本的に何が起こるかを人々に伝えることが最善の策であると感じてきた」とAnthropicの共同創業者ジャック・クラーク氏はインタビューで語った。「今回の大きなストーリーは、一部の一般的な見解に反して、AIの進歩は今後数年間で停滞したり減少したりするのではなく、加速するという兆候が見られることだ」
この変化により、2021年〜2025年のベースラインと比較して、エンジニア1人当たりの四半期ごとのコード出荷量が8倍に増加したと、Anthropic Instituteの責任者マリナ・ファバロ氏とクラーク氏が木曜日に発表したブログ投稿で明らかにした。明確な仕様がない複雑なエンジニアリング問題において、Claudeの成功率は2026年5月に76%に達し、6カ月で50ポイント上昇した。同社の社内モデル「Mythos Preview」は、AIモデルのトレーニングコード最適化において、熟練した人間の開発者が手動リファクタリングで4〜8時間かけて達成する典型的な4倍の改善に対し、52倍の高速化を達成した。
「再帰的自己改善」は、ほとんどの組織が準備できるよりも早く到来する可能性があるとAnthropicは述べた。同社は、リスクがエスカレートした場合に開発を減速または停止するための協調メカニズムをフロンティアAI研究所間で構築するよう呼びかけ、単独の企業による一方的な行動はリーダーシップを移行させるだけで、世界の安全性を向上させるものではないと警告した。「世界的な協調メカニズムがなければ、企業や政府は競争的・地政学的プレッシャーの中での安全性について困難な判断を下さざるを得なくなる」とファバロ氏とクラーク氏は記した。
コーディングのボトルネックは「書くこと」から「レビューすること」へ移行
Anthropicの内部データによると、AIモデルの改善は従来観測されていた7カ月ごとではなく、約4カ月ごとに倍増している。人間の役割は各段階で狭まっている。人間とAIが作成したコードの品質が同等になった時点で(Anthropicは年内にこれを予想)、人間はコードを書くことを完全にやめ、レビューのみに移行する。しかし、レビュー担当者がClaudeの生成速度に追いつけなければ、人間によるレビューがボトルネックとなる。
これに対抗するため、Anthropicは自動化されたClaudeレビューアーを開発パイプラインに導入し、すべてのプルリクエストをアーキテクチャ上の欠陥、セキュリティ上の欠陥、リグレッションバグについて分析している。回顧的分析により、この自動化レイヤーはclaude.aiウェブサイト上の過去の障害の原因となったプロダクションバグの約3分の1を捕捉したことが示された。
2026年4月の事例では、AnthropicのエンジニアがClaudeを導入して、APIエラーの持続的なクラスを解決した。自律的に動作したこのモデルは、800以上の個別修正を出荷し、エラー率を1000分の1に低減した。監督したエンジニアは、人間の開発者が同じ作業を実行するには4年かかったと推定している。
ガバナンスのギャップと今後の展望
OpenAIも再帰的自己改善に関する独自の調査結果を発表しており、2025年12月のブログで、研究者が情報を共有しなければ潜在的に危険な現象であると述べている。同社は安全性研究チームの一部として、再帰的自己改善への備えを担当する研究者を採用している。
Anthropicは今後数カ月のうちに、政策立案者、研究者、市民社会団体、その他のAI企業との協議を開催し、リスク管理と協調メカニズムの改善方法を検討する予定である。同社の研究部門であるAnthropic Instituteは、潜在的な減速を支援するために必要なシステムを研究する。
その影響はAIラボを超えて広がる。米国で月曜日に新規株式公開(IPO)を機密出願し、同社の評価額を9650億ドルとする資金調達ラウンドを実施したAnthropicは、完全な再帰的自己改善により「人間がAIシステムを制御できなくなるリスクが高まる可能性がある」と述べた。投資家にとって、この加速は競争優位性(モート)に関する疑問を提起する。すなわち、AIがより優れたAIを構築できるのであれば、優位性はプロプライエタリなトレーニングデータや人間のエンジニアリング人材から、コンピュートへのアクセスやアライメント研究へと移行する。これらの分野では、Anthropic、OpenAI、Googleのような資本力のあるプレーヤーが構造的優位性を持っている。
本記事は情報提供のみを目的としており、投資助言を構成するものではない。