GoogleのAIが数十年にわたり人間を悩ませてきた数学の問題を解決しましたが、本当の突破口は、AIの数十億ドル規模の「幻覚」問題をいかに終結させるかという点にあります。
GoogleのAIが数十年にわたり人間を悩ませてきた数学の問題を解決しましたが、本当の突破口は、AIの数十億ドル規模の「幻覚」問題をいかに終結させるかという点にあります。

Google DeepMindの「AlphaProof Nexus」は、大規模言語モデルと形式的証明チェックを組み合わせたAIシステムであり、353の未解決のエルデシュ問題のうち9つ、およびオンライン整数列大辞典(OEIS)の492の未解決予想のうち44を解決しました。1問あたりわずか数百ドルというこの突破口は、AI主導の形式的検証における新たな境地を示しており、ミッションクリティカルなソフトウェアの構築方法を一変させる可能性があります。
「検証なしの『フィーリング重視のコーディング(vibe coding)』には注意が必要です。AIシステムは、正しさがもはやオプションではない環境へと急速に移行しているからです」と、競合するAI研究所Logical Intelligenceの創設者兼CEOであるイヴ・ボディナ(Eve Bodina)氏は最近の声明で述べています。「形式的推論のベンチマークは、数学的に正しさが強制される環境でAIシステムを動作させることを強いるため、ますます重要になっています。」
結果は、2026年5月21日に公開されたarXivのプレプリント(2605.22763v1)にまとめられました。AlphaProof Nexusは、大規模言語モデルで数学的証明を生成し、その後、証明支援エンジン「Lean」を使用してすべての論理ステップの正しさをチェックすることで機能します。この「エージェント型ループ(agentic loop)」は、証明が形式的に検証されるまで提案された証明を繰り返し修正するもので、企業への導入を妨げてきたAIの「幻覚(ハルシネーション)」問題に対する直接的な回答となります。
この開発により、AIは「もっともらしいテキストの生成」から「証明可能な正しい論理の構築」へと移行します。その影響は学術界にとどまらず、スマートコントラクトの監査、暗号プロトコルの設計、ゼロ知識証明の生成といった、わずかな論理的エラーが壊滅的な財務損失につながる分野の経済性を変えようとしています。
先端数学にAIで挑んでいるのはGoogleだけではありません。OpenAIは最近、汎用モデルの一つが、新たな反例を発見することで、エルデシュの平面単位距離問題に関連する主要な予想を覆したと発表しました。DeepMindのAlphaProof Nexusが数十年前の予想が正しいことを証明した一方で、OpenAIのモデルは長年信じられてきた数学的定説の欠陥を見つけ出しました。しかし、いずれの成果も、AIの出力をチェックし、洗練させ、解釈するためにエリート数学者の力を借りており、人間と機械の間の新たな分業体制を示唆しています。
アプローチの違いは、AI業界がベンチマークのスコアを競う段階を超え、答えがわかっていない未解決問題の解決へと向かっているという主要なトレンドを浮き彫りにしています。精選されたテストからフロンティア研究へのこの転換は、AIを単なる要約ツールではなく、科学や工学における協力者としての価値を実証するための重要な一歩です。AIが生成する「幻覚」が法廷や学術論文に現れ続けている今、最大の課題は依然として「信頼」にあります。
この技術を商業化する競争はすでに始まっています。エネルギーベースの推論モデルに注力するAI研究所Logical Intelligenceは、同社のエージェント「Aleph」が、高度な数学的定理証明のベンチマークであるPutnamBenchの99.4%を解決したと発表しました。このパフォーマンスは、ByteDanceやその他の競合他社のシステムを大幅に上回っています。
Logical Intelligenceは、イーサリアム財団の暗号ライブラリの作業を含む、本番環境の検証ワークフローにすでにAlephを導入しています。学術的な概念実証から、重要インフラのための商用グレードの検証へのこの移行は、新しい市場が誕生しつつあることを示しています。企業は単にコードを生成するためではなく、失敗が現実世界に深刻な影響を及ぼす本番環境に到達する前に、そのコードが正しいことを証明するためにAIを構築しています。
投資家にとっての重要な洞察は、証明可能な正しい出力を生成する能力が、ミッションクリティカルなシステムでAIを拡張するための基盤的な要件であるということです。このシフトは、現在の生成モデルの最大の弱点である「プレッシャー下での虚偽」という傾向に直接対応するものです。Alphabet(GOOGL)のAlphaProof Nexusによる成果はAI研究におけるリーダーシップを強化するものですが、Logical Intelligenceのような専門企業の台頭は、「検証済みAI」のための新しいインフラ層が構築されつつあることを示しています。金融からエネルギーに至るまで、間違いが許されないあらゆる業界にとって、この技術は不可欠なものとなるでしょう。
本記事は情報提供のみを目的としており、投資勧誘を目的としたものではありません。