OpenAI 削減推理成本50%，發動價格戰打擊競爭對手

OpenAI 將推理成本削減一半，使其在準備 1200 億美元融資的同時，有空間以低價壓制競爭對手。

OpenAI 工程師將部分現有模型的推理成本降低超過 50%，使該公司得以將其旗艦產品 GPT-5.6 Sol 的定價定為競爭對手 Anthropic 的 Claude Fable 5 的一半，同時在基準測試中表現更勝一籌。

據《The Information》報導，該公司將此方法視為「秘方」，並實施嚴格的內部存取權限控管。記者 Steph Palazzolo 表示：「他們甚至不願告訴其他 OpenAI 員工，因為如果這項技術外洩，其他實驗室也能採用並降低自身成本。」

Sol 在 Terminal-Bench 2.1 基準測試中的得分高於 Anthropic 的 Claude Mythos 5，但其成本卻比 Claude Fable 5 低 50%。這些效率提升還讓 OpenAI 得以僅用數百張 Nvidia GPU 來運行未登入的 ChatGPT 流量，對於一個服務數億月活躍用戶的平台而言，這僅是典型需求量的極小部分。

這項成本優勢出現之際，OpenAI 正接近完成一輪 1200 億美元的融資，估值高達 7300 億美元（投資前估值）。執行長 Sam Altman 正推動在 Anthropic 之前進行首次公開發行（IPO）。利潤率改善為這一估值敘事提供了關鍵的財務支撐，而該敘事高度依賴於持續的盈利能力提升。

轉向企業市場

推理技術的突破，為 OpenAI 更廣泛的戰略轉型提供了支撐。應用部門主管 Fidji Simo 在最近的全員會議上告訴員工，公司將降低消費級產品的優先級——例如已關閉並重新分配運算資源的影片生成器 Sora——轉而專注於利潤率更高的企業工具和編碼產品。此舉反映出一個現實：消費級 AI 產品面臨利潤微薄且來自免費替代品的激烈競爭，而企業客戶則願意為可靠性、安全性和客製化支付溢價。

OpenAI 對編碼工具的專注尤具戰略意義。軟體開發是 AI 最大的可觸及市場之一，GitHub Copilot 及類似工具已創造數十億美元的年收入。透過將更低的推理成本與卓越的編碼性能相結合，OpenAI 可以在維持品質的同時，以價格優勢壓制 GitHub Copilot 和 Amazon CodeWhisperer 等競爭對手。

基礎設施獨立性

成本降低也與 OpenAI 加強擁有自身基礎設施的戰略方向一致。該公司近期與 Broadcom 合作開發一款客製化推理晶片，此舉可能降低對 Nvidia GPU 的依賴。Nvidia 最近一個財年的資料中心收入達到 620 億美元，主要來自運行於 H100 和 B200 處理器上的 AI 推理工作負載。一顆客製化晶片每年可為 OpenAI 節省數十億美元的 GPU 採購成本，進一步擴大其相對於依賴第三方硬體的競爭對手的利潤優勢。

這些效率提升可能來自於量化（降低模型權重的精度以加速計算）以及快取優化（儲存常用結果）等技術。這些方法在業界廣為人知，但 OpenAI 能夠實現 50% 的成本降幅，顯示其擁有競爭對手尚未趕上的專有改良技術。

對投資人而言，關鍵問題在於 OpenAI 的成本優勢是否具有可持續性。如果 Anthropic、Google DeepMind 或 Meta 等競爭對手複製了這一方法，定價優勢可能迅速消失。OpenAI 股票並未公開交易，但該公司在私募市場上 7300 億美元的估值，意味著投資人已將持續的利潤率改善納入定價——因此，任何成本優勢的削弱都將對其 IPO 敘事構成風險。該公司與 Broadcom 的合作，以及其對成本降低方法的內部保密措施，顯示 OpenAI 正押注其在推理效率方面的領先地位能夠持續足夠長的時間，從而在競爭對手追趕上來之前鞏固市場佔有率。

本文僅供參考，不構成投資建議。