Anthropic 呼籲全球頂尖 AI 實驗室考慮協調減速,警告 AI 系統可能很快獲得在無需人類監督下自我改進的能力——該公司表示這一門檻可能在兩年內到來。
Anthropic 呼籲全球頂尖 AI 實驗室考慮協調減速,警告 AI 系統可能很快獲得在無需人類監督下自我改進的能力——該公司表示這一門檻可能在兩年內到來。

Anthropic,這家估值 9650 億美元、打造 Claude 聊天機器人的 AI 新創公司,週四發布了一篇部落格文章,呼籲全球領先的人工智慧實驗室考慮協調暫停前沿模型開發。該公司警告,AI 系統正接近「遞歸式自我改進」——即在無需人類干預的情況下設計和建構自身後繼者的能力——並表示這一門檻可能在兩年內或更短時間內到來。
「如果能夠有效減緩這項技術的發展,為我們爭取更多時間來應對其巨大影響,我們認為這很可能是一件好事,」Anthropic 內部研究部門負責人 Marina Favaro 與該公司政策主管 Jack Clark 在題為〈當 AI 建構自身〉的文章中寫道。
這項警告伴隨著 Anthropic 此前從未公開披露的內部數據。截至 2026 年 5 月,Anthropic 生產程式碼庫中超過 80% 的合併程式碼是由該公司的 AI 模型 Claude 編寫的。每位工程師平均每天合併的程式碼量是 2024 年的八倍。在一項針對 130 名研究人員的 3 月調查中,受訪者中位數估計,使用該公司最新模型 Mythos Preview 使其生產力約為不使用任何 AI 工具時的四倍。
呼籲減速的時機對 Anthropic 來說頗為尷尬。該公司近期完成了一輪 650 億美元的 H 輪融資,將其估值推升至約 9650 億美元,使其成為全球最有價值的 AI 新創公司——超越了 OpenAI。該公司也已秘密提交了首次公開募股(IPO)文件。根據該公司數據,其年化營收已從 2025 年底的 900 億美元飆升至 2026 年 6 月估計的 5000 億美元。
遞歸式自我改進的門檻
Anthropic 的核心擔憂在於一個稱為遞歸式自我改進的概念——即 AI 系統能夠在沒有人類指導的情況下自主設計、編碼和訓練其後繼模型。該公司描繪了一條進化路徑:早期的 Claude 模型(2021-2023 年)需要人類編寫所有程式碼;到 2023-2025 年,聊天機器人協助編寫片段;到 2025-2026 年,編碼代理自主編寫和修改整個檔案;而如今,自主代理可以執行程式碼並將任務委派給其他代理。最終階段——Claude 建構並改進未來版本的「閉環」——尚未到來,但 Clark 寫道,他認為這「可能在兩年內或更短時間內發生」。
數據支持能力加速的說法。Claude 可以獨立完成的任務持續時間每四個月翻倍,較此前每七個月翻倍的速度加快。2024 年 3 月的 Claude Opus 3 可以處理約需四分鐘人類工作的任務;一年後的 Claude Opus 4.6 可以處理 12 小時的任務。根據研究組織 METR 的數據,Anthropic 的最新模型 Mythos Preview 可以連續工作至少 16 小時,該組織表示該模型「處於 METR 在不引入新任務的情況下所能測量的上限」。
在 SWE-bench(一項標準的現實世界軟體工程基準測試)上,模型分數在兩年內從個位數上升至接近飽和。在測試模型能否重現已發表研究成果的 CORE-Bench 上,成功率從 2024 年的約 20% 在 15 個月內攀升至飽和該基準。
批評者認為這是監管捕獲的策略
Anthropic 的安全優先姿態引發了競爭對手和行業觀察人士的質疑。OpenAI 執行長 Sam Altman 指責該公司進行「恐懼行銷」,上個月他表示:「很明顯,這是一個絕妙的行銷話術:『我們造了一顆炸彈,我們即將把它丟到你頭上。我們會賣給你一個一億美元的防彈掩體。』」
風險投資人兼美國總統川普的非正式顧問 David Sacks 指責 Anthropic 推行「監管捕獲議程」——利用對存在風險的警告來推動嚴厲監管,從而限制低成本開源模型並提升對 Anthropic 專有技術的需求。
賓州大學華頓商學院教授 Ethan Mollick 在 X 平台上發文表示,這篇部落格文章包含「一些自省、一些行銷,以及大量關於 Anthropic 認為 AI 近期未來的非常真誠的信念」。
Anthropic 承認任何全球暫停措施都面臨驗證挑戰。「訓練運算比導彈發射井更難隱藏,」作者們寫道,將此舉類比為冷戰時期的軍備控制條約。「有意義的減速或暫停需要多個位於或接近前沿的、資源充足的實驗室,在多個國家同意在相同條件下停止。」
該公司表示,其 Anthropic Institute 將與合作夥伴合作研究一個可信的驗證系統應具備的樣貌,並計畫與政策制定者和研究人員組織更廣泛的辯論。Anthropic 表示,如果能夠建立這樣的系統,它願意減緩或暫停自身的開發——前提是其他前沿實驗室能以可驗證的方式做同樣的事。
對投資者的意義
Anthropic 呼籲協調暫停,為整個 AI 產業引入了監管不確定性,而此時正是資本大量湧入的時刻。該公司自身的數據——顯示工程師產出提升 8 倍、生產力提升 4 倍——同時也強化了 AI 能帶來可衡量經濟回報的投資論點。矛盾之處在於,Anthropic 既是 AI 加速發展的受益者,也是呼籲其停止的最大聲者。
OpenAI 預計也將很快尋求 IPO,兩家公司合計代表約 2 兆美元的合併市值。從這場辯論中浮現的任何監管框架都可能決定哪些商業模式——專有與開源、安全優先與速度優先——最終勝出。目前,市場尚未將全球協調暫停的風險納入定價,部分原因是執行機制仍未明確,且作弊的動機極為巨大。
本文僅供資訊參考,不構成投資建議。