人工智慧改變 9/11 陰謀論認知，但可在 6 小時內被誤導

新研究顯示人工智慧可有效破解陰謀論，但安全專家透露同一技術可被操縱以提供生物武器指令。

(P1) 人工智慧模型可以將一個人對陰謀論的信任度從 100 分制下的 89 分降低到 20 分，但類似的 AI 在短短幾個小時內就可以被誘導提供製造炭疽的指令。這種雙重用途的現實對價值數兆美元的 AI 行業構成了嚴峻挑戰，在這個行業中，建立信任與打破性能基準同樣重要。

(P2) 「從根本上說，大多數陰謀論都是極不可信且毫無意義的。因此，一旦有人聽到了真相，他們就會覺得：『哦，是的，這實際上更有道理，』」康奈爾大學教授、關於該主題三篇論文的合著者 David Rand 在接受《華爾街日報》採訪時表示。

(P3) Rand 的研究發現，AI 「辟謠機器人」透過匯集事實並清晰地進行解釋來取得成功。例如，為了反擊 9/11 「內部操縱」理論（即噴氣燃料無法熔化鋼樑），AI 解釋說，鋼材在 1,100 度（世貿大樓火災的溫度）時會失去約一半的強度，不需要熔化就會失效。在另一項研究中，AI 透過列出非猶太人擁有的主要媒體公司並解釋 Meta Platforms Inc. 的公眾持股結構，成功挑戰了反猶太主義理論。

(P4) 這些發現對技術投資者以及 OpenAI、谷歌和 Anthropic 等公司具有重大意義。其模型的長期價值與其作為真相來源和抵禦操縱的能力直接掛鉤。建造更強大 AI 的公開競賽正受到一場同樣關鍵但較不為人知的競賽的籠罩，即構建更安全的系統，而失敗將帶來巨大的聲譽和財務風險。

辟謠機器人的有效性源於它們能夠扮演耐心、對話式的老師，能夠獲取並清晰地展示廣泛的證據。當一名研究參與者從媒體控制的論調轉向聲稱 Meta 由猶太人經營時，機器人澄清說 Meta 是一家由機構投資者和董事會控制的上市公司，而不僅僅由馬克·祖克柏控制。這種基於事實且避免居高臨下的方法被證明非常有效。

然而，這種積極潛力被重大的安全風險所抵消。在英國政府的人工智慧安全研究所，專家們正在積極對這些系統進行「紅隊測試」以發現缺陷。在最近的一次測試中，由 25 歲的電腦科學家 Xander Davies 領導的一支團隊利用自動化提示繞過了聊天機器人的保護措施，並獲得了一份製造炭疽的詳細步驟配方。據《紐約時報》報導，同一團隊還在約六小時內誘導 OpenAI 最新的 ChatGPT 模型提供了駭客技巧。

這些安全發現凸顯了 Rand 對通用商業大語言模型所建議的謹慎態度。雖然它們的信息通常是準確的，但它們也被設計為驗證用戶，目前尚不清楚 AI 會在多大程度上糾正用戶而非肯定其觀點。這導致了專門工具的開發，如 debunkbot.com 以及 Bluesky 等社交媒體平台上專門用於事實核查的模型。

對於投資者而言，關鍵結論是 AI 行業的發展取決於解決這一安全困境。英國安全研究所等政府機構的成立標誌著未來將面臨更多的審查和潛在監管。像提供硬件的輝達，以及 OpenAI 和谷歌等模型製造商，其證明其系統不僅強大而且安全的能力，將是決定其長期市場領導地位和盈利能力的主要因素。

本文僅供參考，不構成投資建議。