輝達整合200億美元Groq知識產權,實現低延遲AI推論
在GTC 2026大會上,輝達推出了Groq LPX推論機架,這是其以200億美元收購Groq知識產權和團隊後推出的首個主要產品。該系統將Groq的低延遲處理單元(LPU)架構與輝達GPU整合,以優化AI推論。透過一種名為「注意力前饋網絡分解(Attention FFN Disaggregation)」的技術,系統根據硬體優勢分配任務:GPU負責動態注意力計算,而新型LP30 LPU晶片處理靜態前饋網絡(FFN)計算,顯著減少了互動式AI應用的響應延遲。
對投資者而言至關重要的是,LP30晶片採用三星SF4製程製造,不使用高頻寬記憶體(HBM)。這意味著新的LPX系統為輝達帶來了增量的生產能力和收入,因為它不佔用公司稀缺的台積電N3製造插槽或HBM供應,這是一個不易被複製的關鍵競爭優勢。
Vera ETL256機架集成了256顆CPU,打破AI瓶頸
為解決大規模AI操作中日益增長的CPU瓶頸,輝達推出了Vera ETL256。這款高密度液冷系統在一個機架中整合了256顆新型Vera CPU。該設計直接針對數據準備和強化學習等任務中大規模平行處理的需求,這些任務中CPU的可用性可能限制整體GPU利用率。透過將計算密度整合到所有機架內連接都可以使用銅纜完成的程度,輝達消除了對機架內更昂貴光收發器的需求,從而抵消了液冷成本。
除了CPU機架,輝達還發布了STX儲存參考架構。該架構標準化了AI儲存系統的配置,明確了驅動器、Vera CPU、BlueField DPU和網路組件所需的組合。在戴爾、惠普企業(HPE)和IBM等主要儲存供應商的支持下,STX架構鞏固了輝達從計算和網路領域向儲存層面的擴展,而該領域此前由其他公司控制。
輝達旨在掌控整個AI基礎設施市場
LPX、Vera ETL256和STX系統的聯合發布標誌著一個明確的戰略轉變。輝達正積極提供整個AI基礎設施堆棧,創建一個深度整合的生態系統,以擴大其市場主導地位。這一平台戰略已獲得關注,Cadence和HPE等合作夥伴宣布了基於輝達最新硬體的新解決方案。這些聲明為輝達如何實現首席執行官黃仁勳預測的到2027年獲得1萬億美元系統訂單的目標提供了具體路線圖。
透過系統性地進入CPU和儲存市場,輝達正在將自己定位為能夠捕獲AI硬體總支出中更大份額的公司。此舉加劇了這些領域現有參與者的競爭,並強化了輝達作為AI行業大規模基礎設施建設核心提供商的角色。