OpenAI 的 GPT-5.5 僅用 10 分鐘破解 12 小時的安全謎題

根據一份新的政府報告，OpenAI 的新 GPT-5.5 模型能夠自主執行複雜的多階段網絡攻擊，並以遠超人類專家的速度解決複雜的安全挑戰。英國人工智慧安全研究所 (AISI) 的發現將 GPT-5.5 的攻擊能力與 Anthropic 的 Claude Mythos 並列，表明人工智慧被惡意利用的潛力正在快速、廣泛地增長，這是一種普遍趨勢，而非孤立的突破。

「如果攻擊性網絡技能是推理、編碼和自主任務完成能力廣泛提升的副產品，那麼進一步的進步可能會接踵而至，」英國科學、創新和技術部下轄的研究機構人工智慧安全研究所在報告中警告稱。

報告詳細介紹了 GPT-5.5 在 10 次嘗試中兩次自主完成了 32 步模擬企業網絡攻擊。這項由 SpecterOps 設計、被稱為「The Last Ones」的測試，此前僅由 Anthropic 的 Claude Mythos 預覽版完成過（10 次嘗試中完成 3 次）。在一項更為驚人的測試中，GPT-5.5 僅用 10 分 22 秒就破解了一個人類專家需要 12 小時的逆向工程謎題，而 API 使用成本僅為 1.73 美元。在更廣泛的專家級網絡安全任務中，GPT-5.5 的通過率達到了 71.4%，略領先於 Mythos 預覽版的 68.6%，遠超 GPT-5.4 的 52.4%。

這種攻擊能力的飛躍創造了雙面市場衝擊：它暴露了企業的嚴重漏洞，令安全態勢薄弱的公司前景看淡；同時，它也成為網絡安全行業的強力牛市催化劑。隨著該報告的發布，英國政府宣布了 9000 萬英鎊的新網絡彈性資金，這一市場動態預示著對人工智慧驅動的防禦解決方案的需求將激增，並加劇對人工智慧開發者的監管壓力。

攻防不平衡加劇

AISI 的發現發布之際，市場正處於一場結構性失衡的軍備競賽中。幣安 (Binance) 的研究顯示，目前人工智慧工具在利用智能合約漏洞方面的效率是檢測漏洞的兩倍。該公司的報告指出，GPT-5.3-Codex 在 EVMbench 基準測試的「利用」模式下達到了 72.2% 的成功率，而「檢測」模式下的成功率僅為一半左右。

這種不對稱性是由攻擊成本的崩潰驅動的。根據幣安研究院的數據，人工智慧驅動的漏洞利用目前平均每個合約約 1.22 美元，預計這一數字每兩個月將下降 22%。雖然超過 80% 的開發人員現在在工作流程中使用人工智慧，但只有不到 40% 的人將其用於高級安全測試，這為自動化威脅留下了巨大的利用空間。這一趨勢不僅限於代碼；TRM Labs 的分析師推測，北韓黑客組織正在利用人工智慧進行複雜的社會工程學攻擊，這與其傳統上依賴更簡單攻擊媒介的做法有所不同。

市場對人工智慧風險看法不一

這些能力的快速湧現引發了關於負責任披露和營銷的辯論。OpenAI 首席執行官薩姆·奧特曼 (Sam Altman) 最近批評了他所謂的「基於恐懼的營銷」，暗示那些誇大模型危險性以推銷安全解決方案的競爭對手。奧特曼在最近的一次播客採訪中表示：「『我們造了一枚炸彈。我們要把它扔到你頭上。我們將以 1 億美元的價格賣給你一個防空洞，』這顯然是不可思議的營銷。」

為了應對日益增長的威脅，OpenAI 和 Anthropic 都在限制其最強大模型的訪問。Anthropic 將 Mythos 預覽版的初始發布限制在「關鍵行業合作夥伴」，而 OpenAI 正在向經過審查的「關鍵網絡防禦者」名單推出專業版 GPT-5.5-Cyber。採取這種謹慎做法的原因是，研究人員在公共 GPT-5.5 模型中發現了一個「通用越獄」漏洞，繞過了其安全護欄，紅隊用了六個小時開發出這種攻擊方式。雖然 OpenAI 此後發布了補丁，但該事件突顯了濫用的持續風險，這令投資者感到擔憂，因為去年有 43% 的英國企業報告曾遭受網絡攻擊。

本文僅供參考，不構成投資建議。