Key Takeaways:
- OpenAI 聯合創始人 Andrej Karpathy 宣布「軟體 3.0」時代到來,這一以「代理工程」為核心的新範式據稱可讓專業開發者的生產力提升遠超 10 倍。
- 物流巨頭 C.H. Robinson 堪稱現實案例,自 2022 年實施「精益 AI」戰略並部署自定義 AI 代理以來,其貨運效率提升了 50% 以上。
- 儘管代理提供了極高的速度,但企業正在實施「政策即代碼」作為護欄以管控風險,這一必要步驟源於 AI 代理在商業模擬中犯下高昂代價錯誤的實驗。
Key Takeaways:

OpenAI 聯合創始人 Andrej Karpathy 認為,向「軟體 3.0」的範式轉變已經開始,AI 代理有望為專業開發者帶來遠超 10 倍的生產力提升。
OpenAI 聯合創始人 Andrej Karpathy 表示,軟體開發的一個根本性轉變正在超越簡單的代碼補全,轉向對功能強大但並非萬無一失的 AI 代理進行複雜編排。這種他稱之為「代理工程」的新範式已經在物流巨頭 C.H. Robinson 產生了顯著的生產力收益。自 2022 年實施「精益 AI」戰略以來,該公司每人每日的貨運量增加了 50% 以上。
Karpathy 在 4 月 29 日的一次採訪中說:「人們過去常談論『10 倍工程師』,但 10 倍已不足以描述你獲得的提速。在我看來,善於此道的人的產出遠不止 10 倍。」
Karpathy 將這種新的專業標準與「氛圍編程」(vibe programming)區分開來,後者是指每個人透過 ChatGPT 等工具獲得的通用編程能力提升。他認為,代理工程的關鍵在於在利用 AI 代理巨大速度的同時,維持專業應用程式的質量和安全上限。他聲稱,這一轉型在 12 月迎來了轉折點,當時最新模型的能力使基於代理的工作流在處理複雜任務時真正變得可行。
向代理驅動開發模式的轉變迫使公司構建「代理原生」基礎設施,並重新評估人才招聘方式。正如 C.H. Robinson 擁有 450 人的 AI 團隊所證明的那樣,真正的競爭護城河不在於獲取模型,而在於擁有引導模型有效實現業務目標所需的專有數據和應用層。
Karpathy 指出,當前 AI 的能力是「參差不齊的」。他舉了一個例子:一個尖端模型可能發現軟體漏洞,但也會建議用戶走路去洗車房。他認為,成功應用 AI 的關鍵在於「可驗證性」。在數學和編程等領域,AI 的輸出可以輕鬆且自動地檢查正確性,因此效果最好。這是前沿實驗室集中進行強化學習努力的地方,從而創造了這種參差不齊的前沿。對於初創公司和投資者來說,這意味著最大的機會可能在於識別其他尚未被主要實驗室用強化學習飽和的高價值、可驗證的業務領域。
雖然 Karpathy 極力推崇代理的力量,但企業正謹慎行事,實施硬編碼規則以防止代價高昂的錯誤。最近的一份《福布斯》報告強調了一個實驗:一個名為 Claudius 的 AI 代理被指派運行一台自動售貨機,結果很快就被誘導至破產。此類場景導致 31% 的企業將合規擔憂列為擴展 AI 的主要障礙。
據受監管行業的專家稱,解決方案是「政策即代碼」。這種方法不是依賴可以被規避的自然語言提示,而是將確定的、機器可讀的規則直接構建到系統中,使代理不可能違反這些規則。當代理遇到其政策邊界以外的情況時,它會向人工上報,而不是即興發揮。
向代理工程的轉變並非理論,它正在變為現實。C.H. Robinson 的首席運營官 Arun D. Rajan 在公司最近的財報電話會議上解釋說,擁有應用層是他們的關鍵競爭優勢。Rajan 說:「獲取 AI 本身並不是差異化因素,AI 的有效性取決於驅動它的數據和上下文。」
這一觀點在整個行業得到了共鳴,即將舉行的 QCon AI 波士頓大會設立了專門討論「生產環境中的代理」、「生產級 AI 的上下文工程」以及「零信任代理系統」的分論壇。這些曾經的研究概念現在已成為大規模運營公司的核心工程問題。
在 Karpathy 看來,這都是向「軟體 3.0」轉型的一部分,屆時神經網絡最終可能成為主要處理器,而 CPU 則退居協處理器的地位。在這個未來中,人類最有價值的貢獻將從執行轉為判斷。Karpathy 引用了一句令他印象深刻的話:「你可以外包你的思考,但你不能外包你的理解。」
本文僅供參考,不構成投資建議。