Anthropic 呼籲全球暫停 AI 開發，警告模型即將達到自我改進里程碑

Anthropic，這家估值 9650 億美元、打造 Claude 聊天機器人的 AI 新創公司，週四發布了一篇部落格文章，呼籲全球領先的人工智慧實驗室考慮協調暫停前沿模型開發。該公司警告，AI 系統正接近「遞歸式自我改進」——即在無需人類干預的情況下設計和建構自身後繼者的能力——並表示這一門檻可能在兩年內或更短時間內到來。

「如果能夠有效減緩這項技術的發展，為我們爭取更多時間來應對其巨大影響，我們認為這很可能是一件好事，」Anthropic 內部研究部門負責人 Marina Favaro 與該公司政策主管 Jack Clark 在題為〈當 AI 建構自身〉的文章中寫道。

這項警告伴隨著 Anthropic 此前從未公開披露的內部數據。截至 2026 年 5 月，Anthropic 生產程式碼庫中超過 80% 的合併程式碼是由該公司的 AI 模型 Claude 編寫的。每位工程師平均每天合併的程式碼量是 2024 年的八倍。在一項針對 130 名研究人員的 3 月調查中，受訪者中位數估計，使用該公司最新模型 Mythos Preview 使其生產力約為不使用任何 AI 工具時的四倍。

呼籲減速的時機對 Anthropic 來說頗為尷尬。該公司近期完成了一輪 650 億美元的 H 輪融資，將其估值推升至約 9650 億美元，使其成為全球最有價值的 AI 新創公司——超越了 OpenAI。該公司也已秘密提交了首次公開募股（IPO）文件。根據該公司數據，其年化營收已從 2025 年底的 900 億美元飆升至 2026 年 6 月估計的 5000 億美元。

遞歸式自我改進的門檻

Anthropic 的核心擔憂在於一個稱為遞歸式自我改進的概念——即 AI 系統能夠在沒有人類指導的情況下自主設計、編碼和訓練其後繼模型。該公司描繪了一條進化路徑：早期的 Claude 模型（2021-2023 年）需要人類編寫所有程式碼；到 2023-2025 年，聊天機器人協助編寫片段；到 2025-2026 年，編碼代理自主編寫和修改整個檔案；而如今，自主代理可以執行程式碼並將任務委派給其他代理。最終階段——Claude 建構並改進未來版本的「閉環」——尚未到來，但 Clark 寫道，他認為這「可能在兩年內或更短時間內發生」。

數據支持能力加速的說法。Claude 可以獨立完成的任務持續時間每四個月翻倍，較此前每七個月翻倍的速度加快。2024 年 3 月的 Claude Opus 3 可以處理約需四分鐘人類工作的任務；一年後的 Claude Opus 4.6 可以處理 12 小時的任務。根據研究組織 METR 的數據，Anthropic 的最新模型 Mythos Preview 可以連續工作至少 16 小時，該組織表示該模型「處於 METR 在不引入新任務的情況下所能測量的上限」。

在 SWE-bench（一項標準的現實世界軟體工程基準測試）上，模型分數在兩年內從個位數上升至接近飽和。在測試模型能否重現已發表研究成果的 CORE-Bench 上，成功率從 2024 年的約 20% 在 15 個月內攀升至飽和該基準。

批評者認為這是監管捕獲的策略

Anthropic 的安全優先姿態引發了競爭對手和行業觀察人士的質疑。OpenAI 執行長 Sam Altman 指責該公司進行「恐懼行銷」，上個月他表示：「很明顯，這是一個絕妙的行銷話術：『我們造了一顆炸彈，我們即將把它丟到你頭上。我們會賣給你一個一億美元的防彈掩體。』」

風險投資人兼美國總統川普的非正式顧問 David Sacks 指責 Anthropic 推行「監管捕獲議程」——利用對存在風險的警告來推動嚴厲監管，從而限制低成本開源模型並提升對 Anthropic 專有技術的需求。

賓州大學華頓商學院教授 Ethan Mollick 在 X 平台上發文表示，這篇部落格文章包含「一些自省、一些行銷，以及大量關於 Anthropic 認為 AI 近期未來的非常真誠的信念」。

Anthropic 承認任何全球暫停措施都面臨驗證挑戰。「訓練運算比導彈發射井更難隱藏，」作者們寫道，將此舉類比為冷戰時期的軍備控制條約。「有意義的減速或暫停需要多個位於或接近前沿的、資源充足的實驗室，在多個國家同意在相同條件下停止。」

該公司表示，其 Anthropic Institute 將與合作夥伴合作研究一個可信的驗證系統應具備的樣貌，並計畫與政策制定者和研究人員組織更廣泛的辯論。Anthropic 表示，如果能夠建立這樣的系統，它願意減緩或暫停自身的開發——前提是其他前沿實驗室能以可驗證的方式做同樣的事。

對投資者的意義

Anthropic 呼籲協調暫停，為整個 AI 產業引入了監管不確定性，而此時正是資本大量湧入的時刻。該公司自身的數據——顯示工程師產出提升 8 倍、生產力提升 4 倍——同時也強化了 AI 能帶來可衡量經濟回報的投資論點。矛盾之處在於，Anthropic 既是 AI 加速發展的受益者，也是呼籲其停止的最大聲者。

OpenAI 預計也將很快尋求 IPO，兩家公司合計代表約 2 兆美元的合併市值。從這場辯論中浮現的任何監管框架都可能決定哪些商業模式——專有與開源、安全優先與速度優先——最終勝出。目前，市場尚未將全球協調暫停的風險納入定價，部分原因是執行機制仍未明確，且作弊的動機極為巨大。

本文僅供資訊參考，不構成投資建議。