慧與科技(HPE)全新ProLiant伺服器採用Nvidia Vera CPU,是首款針對代理式AI打造的企業級基礎設施產品——Nvidia稱該市場價值2000億美元。
慧與科技(HPE)全新ProLiant伺服器採用Nvidia Vera CPU,是首款針對代理式AI打造的企業級基礎設施產品——Nvidia稱該市場價值2000億美元。

慧與科技(HPE)全新ProLiant伺服器採用Nvidia Vera CPU,是首款針對代理式AI打造的企業級基礎設施產品——Nvidia稱該市場價值2000億美元。
慧與科技(Hewlett Packard Enterprise)週一推出HPE ProLiant Compute DL394 Gen12,這款2U伺服器搭載Nvidia Vera CPU,雙方表示其專為代理式AI工作負載而設計。該伺服器於台北國際電腦展(Computex)亮相,採用LPDDR5X記憶體,提供高達1.2 TB/s的聚合記憶體頻寬——相當於每核心14 GB/s——解決了長期以來限制CPU系統AI推論的記憶體瓶頸問題。
「從生成式模型轉向代理式系統,正在重新定義企業運算的角色,」HPE總裁兼執行長安東尼奧·奈里(Antonio Neri)在聲明中表示。「這些工作負載需要具備卓越CPU效能的高性能伺服器,才能在代理式AI及金融服務應用中實現即時推理。」
Vera CPU採用單晶片設計(monolithic design),而非x86處理器常見的高核心數小晶片架構(chiplet architectures),後者因非均勻記憶體存取(NUMA)問題而產生可變延遲。透過直接整合LPDDR5X記憶體,該系統實現了確定性效能——這對金融服務領域至關重要,因為微秒級的延遲就會帶來實際成本。紐約證券交易所每日處理超過1.1兆條訊息,目前正與HPE、Nvidia及數據串流公司Redpanda合作,共同探索該平台。
「代理式AI已經到來,它需要一款新的CPU,」Nvidia創辦人兼執行長黃仁勳(Jensen Huang)表示。「Vera專為編排AI工廠而生——效能提升2倍,任務完成速度優於x86。」
為何Vera架構對AI工作負載至關重要
Nvidia的Vera CPU代表其脫離傳統以GPU為中心的策略。與仰賴小晶片設計、透過互連技術連接多個晶粒的x86伺服器晶片不同,Vera採用單一單晶片設計,並整合LPDDR5X記憶體控制器。這消除了與NUMA相關的延遲變異性,而當AI代理必須即時推理和回應時,這項特性變得至關重要。
根據已公布的規格,1.2 TB/s的記憶體頻寬,相較於英特爾(Intel)和超微(AMD)當前世代x86伺服器處理器約500至700 GB/s的頻寬,具有明顯優勢。對於代理式AI工作負載——模型必須擷取上下文、跨多個資料來源進行推理,並依序產生回應——記憶體頻寬往往比原始運算時脈速度更能決定吞吐量。
HPE表示,該伺服器將於2026年秋季上市,作為其Nvidia AI Computing by HPE產品組合的一部分。該公司還透過其90/9 Advantage方案提供融資,該方案允許客戶在90天後開始付款,隨後九個月利率為1%。
安全性與管理作為競爭差異化優勢
HPE表示,DL394 Gen12是首款符合NIST量子運算抗量子安全要求的HPE伺服器。它透過HPE的Silicon Root of Trust在韌體層級嵌入安全性,並利用其Integrated Lights-Out 7管理控制器中的安全隔離區(secure enclave),在伺服器整個生命週期中提供保護。
HPE Compute Ops Management提供統一的儀表板來管理分散式伺服器環境,透過AI驅動的運維管理,減少管理時間並將停機造成的收入損失降至最低,該公司表示。
競爭態勢十分激烈。Nvidia的Vera CPU為該公司與英特爾及超微的競爭開闢了新戰線,後兩者主導著2000億美元的伺服器CPU市場。如果Vera能實現黃仁勳所稱的2倍效率提升,它可能會侵蝕x86在企業數據中心的主導地位——尤其是在AI推論領域,因為延遲和記憶體頻寬比原始核心數量更為重要。
HPE股價週一盤前交易上漲1.8%。Nvidia股價過去一年漲幅超過80%,週一變化不大。該伺服器要到2026年秋季才上市,意味著任何營收貢獻至少還需兩個季度,但NYSE試點計畫提供了一個標竿性的參考客戶,可能加速企業採用。
本文僅供資訊參考,不構成投資建議。