HPE推出Vera驅動伺服器，瞄準2000億美元代理式AI市場

慧與科技（HPE）全新ProLiant伺服器採用Nvidia Vera CPU，是首款針對代理式AI打造的企業級基礎設施產品——Nvidia稱該市場價值2000億美元。

慧與科技（Hewlett Packard Enterprise）週一推出HPE ProLiant Compute DL394 Gen12，這款2U伺服器搭載Nvidia Vera CPU，雙方表示其專為代理式AI工作負載而設計。該伺服器於台北國際電腦展（Computex）亮相，採用LPDDR5X記憶體，提供高達1.2 TB/s的聚合記憶體頻寬——相當於每核心14 GB/s——解決了長期以來限制CPU系統AI推論的記憶體瓶頸問題。

「從生成式模型轉向代理式系統，正在重新定義企業運算的角色，」HPE總裁兼執行長安東尼奧·奈里（Antonio Neri）在聲明中表示。「這些工作負載需要具備卓越CPU效能的高性能伺服器，才能在代理式AI及金融服務應用中實現即時推理。」

Vera CPU採用單晶片設計（monolithic design），而非x86處理器常見的高核心數小晶片架構（chiplet architectures），後者因非均勻記憶體存取（NUMA）問題而產生可變延遲。透過直接整合LPDDR5X記憶體，該系統實現了確定性效能——這對金融服務領域至關重要，因為微秒級的延遲就會帶來實際成本。紐約證券交易所每日處理超過1.1兆條訊息，目前正與HPE、Nvidia及數據串流公司Redpanda合作，共同探索該平台。

「代理式AI已經到來，它需要一款新的CPU，」Nvidia創辦人兼執行長黃仁勳（Jensen Huang）表示。「Vera專為編排AI工廠而生——效能提升2倍，任務完成速度優於x86。」

為何Vera架構對AI工作負載至關重要

Nvidia的Vera CPU代表其脫離傳統以GPU為中心的策略。與仰賴小晶片設計、透過互連技術連接多個晶粒的x86伺服器晶片不同，Vera採用單一單晶片設計，並整合LPDDR5X記憶體控制器。這消除了與NUMA相關的延遲變異性，而當AI代理必須即時推理和回應時，這項特性變得至關重要。

根據已公布的規格，1.2 TB/s的記憶體頻寬，相較於英特爾（Intel）和超微（AMD）當前世代x86伺服器處理器約500至700 GB/s的頻寬，具有明顯優勢。對於代理式AI工作負載——模型必須擷取上下文、跨多個資料來源進行推理，並依序產生回應——記憶體頻寬往往比原始運算時脈速度更能決定吞吐量。

HPE表示，該伺服器將於2026年秋季上市，作為其Nvidia AI Computing by HPE產品組合的一部分。該公司還透過其90/9 Advantage方案提供融資，該方案允許客戶在90天後開始付款，隨後九個月利率為1%。

安全性與管理作為競爭差異化優勢

HPE表示，DL394 Gen12是首款符合NIST量子運算抗量子安全要求的HPE伺服器。它透過HPE的Silicon Root of Trust在韌體層級嵌入安全性，並利用其Integrated Lights-Out 7管理控制器中的安全隔離區（secure enclave），在伺服器整個生命週期中提供保護。

HPE Compute Ops Management提供統一的儀表板來管理分散式伺服器環境，透過AI驅動的運維管理，減少管理時間並將停機造成的收入損失降至最低，該公司表示。

競爭態勢十分激烈。Nvidia的Vera CPU為該公司與英特爾及超微的競爭開闢了新戰線，後兩者主導著2000億美元的伺服器CPU市場。如果Vera能實現黃仁勳所稱的2倍效率提升，它可能會侵蝕x86在企業數據中心的主導地位——尤其是在AI推論領域，因為延遲和記憶體頻寬比原始核心數量更為重要。

HPE股價週一盤前交易上漲1.8%。Nvidia股價過去一年漲幅超過80%，週一變化不大。該伺服器要到2026年秋季才上市，意味著任何營收貢獻至少還需兩個季度，但NYSE試點計畫提供了一個標竿性的參考客戶，可能加速企業採用。

本文僅供資訊參考，不構成投資建議。