OpenAI 將推理成本削減一半,使其在準備 1200 億美元融資的同時,有空間以低價壓制競爭對手。
OpenAI 將推理成本削減一半,使其在準備 1200 億美元融資的同時,有空間以低價壓制競爭對手。

OpenAI 將推理成本削減一半,使其在準備 1200 億美元融資的同時,有空間以低價壓制競爭對手。
OpenAI 工程師將部分現有模型的推理成本降低超過 50%,使該公司得以將其旗艦產品 GPT-5.6 Sol 的定價定為競爭對手 Anthropic 的 Claude Fable 5 的一半,同時在基準測試中表現更勝一籌。
據《The Information》報導,該公司將此方法視為「秘方」,並實施嚴格的內部存取權限控管。記者 Steph Palazzolo 表示:「他們甚至不願告訴其他 OpenAI 員工,因為如果這項技術外洩,其他實驗室也能採用並降低自身成本。」
Sol 在 Terminal-Bench 2.1 基準測試中的得分高於 Anthropic 的 Claude Mythos 5,但其成本卻比 Claude Fable 5 低 50%。這些效率提升還讓 OpenAI 得以僅用數百張 Nvidia GPU 來運行未登入的 ChatGPT 流量,對於一個服務數億月活躍用戶的平台而言,這僅是典型需求量的極小部分。
這項成本優勢出現之際,OpenAI 正接近完成一輪 1200 億美元的融資,估值高達 7300 億美元(投資前估值)。執行長 Sam Altman 正推動在 Anthropic 之前進行首次公開發行(IPO)。利潤率改善為這一估值敘事提供了關鍵的財務支撐,而該敘事高度依賴於持續的盈利能力提升。
轉向企業市場
推理技術的突破,為 OpenAI 更廣泛的戰略轉型提供了支撐。應用部門主管 Fidji Simo 在最近的全員會議上告訴員工,公司將降低消費級產品的優先級——例如已關閉並重新分配運算資源的影片生成器 Sora——轉而專注於利潤率更高的企業工具和編碼產品。此舉反映出一個現實:消費級 AI 產品面臨利潤微薄且來自免費替代品的激烈競爭,而企業客戶則願意為可靠性、安全性和客製化支付溢價。
OpenAI 對編碼工具的專注尤具戰略意義。軟體開發是 AI 最大的可觸及市場之一,GitHub Copilot 及類似工具已創造數十億美元的年收入。透過將更低的推理成本與卓越的編碼性能相結合,OpenAI 可以在維持品質的同時,以價格優勢壓制 GitHub Copilot 和 Amazon CodeWhisperer 等競爭對手。
基礎設施獨立性
成本降低也與 OpenAI 加強擁有自身基礎設施的戰略方向一致。該公司近期與 Broadcom 合作開發一款客製化推理晶片,此舉可能降低對 Nvidia GPU 的依賴。Nvidia 最近一個財年的資料中心收入達到 620 億美元,主要來自運行於 H100 和 B200 處理器上的 AI 推理工作負載。一顆客製化晶片每年可為 OpenAI 節省數十億美元的 GPU 採購成本,進一步擴大其相對於依賴第三方硬體的競爭對手的利潤優勢。
這些效率提升可能來自於量化(降低模型權重的精度以加速計算)以及快取優化(儲存常用結果)等技術。這些方法在業界廣為人知,但 OpenAI 能夠實現 50% 的成本降幅,顯示其擁有競爭對手尚未趕上的專有改良技術。
對投資人而言,關鍵問題在於 OpenAI 的成本優勢是否具有可持續性。如果 Anthropic、Google DeepMind 或 Meta 等競爭對手複製了這一方法,定價優勢可能迅速消失。OpenAI 股票並未公開交易,但該公司在私募市場上 7300 億美元的估值,意味著投資人已將持續的利潤率改善納入定價——因此,任何成本優勢的削弱都將對其 IPO 敘事構成風險。該公司與 Broadcom 的合作,以及其對成本降低方法的內部保密措施,顯示 OpenAI 正押注其在推理效率方面的領先地位能夠持續足夠長的時間,從而在競爭對手追趕上來之前鞏固市場佔有率。
本文僅供參考,不構成投資建議。