重點摘要:
- 小米將MiMo-V2.5 API價格永久調降最高99%
- 輸入快取命中價格降至每百萬個token 0.025元人民幣
- 此舉緊接DeepSeek將其V4-Pro模型價格削減75%之後
重點摘要:

小米集團 (Xiaomi Corp.) 自周三起全球永久調降其MiMo-V2.5系列大型語言模型API價格最高達99%,加劇了已在中國AI供應商之間爆發的價格戰,此前DeepSeek已將旗艦模型成本削減75%。
「新定價取消了基於上下文窗口長度的區分,使企業級工作負載的AI推理變得大規模可負擔,」該公司在聲明中表示。小米還在其優化的Token計畫下推出了基於Credits的計費系統,使用量可達原始水準的五到八倍而無需額外收費。
MiMo-V2.5 Pro版本目前輸入快取命中價格為每百萬個token 0.025元人民幣,較先前定價減少99%;而標準版MiMo-V2.5則降至每百萬個token 0.02元人民幣,降幅達98%。輸出定價方面,Pro版本降至每百萬個token 6元人民幣(下降86%),標準版本降至每百萬個token 2元人民幣(下降93%)。上述調整適用於全球。
此次降價使小米的推理定價低於DeepSeek近期打折後的V4-Pro——後者快取命中輸入價格為每百萬個token 0.003625美元,按當前匯率約相當於小米的0.025元人民幣——輸出價格最高為每百萬個token 0.87美元。DeepSeek已於5月將其75%的降價永久化,理由是效率提升而非促銷折扣。「這不是折扣,而是效率提升所帶來的成本傳遞,」Greyhound Research首席分析師Sanchit Vir Gogia在談到DeepSeek此舉時表示。
根據政府支持的產業預測,中國生成式AI市場預計在未來十年內每年增長超過35%,截至2026年初已有超過300個註冊的生成式AI服務。這場價格戰將小米與DeepSeek、阿里巴巴的通義千問、百度的文心一言以及騰訊的混元模型對決,這些企業在過去兩年內均擴大了大型語言模型的產品線。業界分析師表示,持續的降價可能引發類似於2010年代重塑中國網路產業的雲端運算定價戰。
較低的推理成本也可能推升對運算基礎設施的需求,因為企業開始大規模部署AI。中國的AI伺服器與資料中心市場預計在未來十年內以兩位數的增長率擴張,使包括華為在內的國內硬體供應商以及尋求替代受限美國技術的中國伺服器製造商受益。國際能源署警告,隨著AI應用加速,全球資料中心用電量到2030年可能翻倍以上,達到每年約1,000太瓦時。
對小米而言,這項激進的定價策略可能有助於推動其AI服務在智慧型手機與物聯網生態系統中的採用,但對利潤率的影響仍不明朗。小米股價周三在香港下跌1.8%,賣空交易佔成交量的29.5%。該公司未披露此次降價對預期營收的影響,也未說明目前使用其MiMo模型的企業客戶數量。
本文僅供參考,不構成投資建議。