英伟达整合200亿美元Groq知识产权,实现低延迟AI推理
在GTC 2026大会上,英伟达推出了Groq LPX推理机架,这是其以200亿美元收购Groq知识产权和团队后推出的首个主要产品。该系统将Groq的低延迟处理单元(LPU)架构与英伟达GPU集成,以优化AI推理。通过一种名为“注意力前馈网络分解(Attention FFN Disaggregation)”的技术,系统根据硬件优势分配任务:GPU负责动态注意力计算,而新型LP30 LPU芯片处理静态前馈网络(FFN)计算,显著减少了交互式AI应用的响应延迟。
对投资者而言至关重要的是,LP30芯片采用三星SF4工艺制造,不使用高带宽内存(HBM)。这意味着新的LPX系统为英伟达带来了增量的生产能力和收入,因为它不占用公司稀缺的台积电N3制造插槽或HBM供应,这是一个不易被复制的关键竞争优势。
Vera ETL256机架集成了256颗CPU,打破AI瓶颈
为解决大规模AI操作中日益增长的CPU瓶颈,英伟达推出了Vera ETL256。这款高密度液冷系统在一个机架中集成了256颗新型Vera CPU。该设计直接针对数据准备和强化学习等任务中大规模并行处理的需求,这些任务中CPU的可用性可能限制整体GPU利用率。通过将计算密度集成到所有机架内连接都可以使用铜缆完成的程度,英伟达消除了对机架内更昂贵光收发器的需求,从而抵消了液冷成本。
除了CPU机架,英伟达还发布了STX存储参考架构。该架构标准化了AI存储系统的配置,明确了驱动器、Vera CPU、BlueField DPU和网络组件所需的组合。在戴尔、惠普企业(HPE)和IBM等主要存储供应商的支持下,STX架构巩固了英伟达从计算和网络领域向存储层面的扩展,而该领域此前由其他公司控制。
英伟达旨在掌控整个AI基础设施市场
LPX、Vera ETL256和STX系统的联合发布标志着一个明确的战略转变。英伟达正积极提供整个AI基础设施堆栈,创建一个深度集成的生态系统,以扩大其市场主导地位。这一平台战略已获得关注,Cadence和HPE等合作伙伴宣布了基于英伟达最新硬件的新解决方案。这些声明为英伟达如何实现首席执行官黄仁勋预测的到2027年获得1万亿美元系统订单的目标提供了具体路线图。
通过系统性地进入CPU和存储市场,英伟达正在将自己定位为能够捕获AI硬件总支出中更大份额的公司。此举加剧了这些领域现有参与者的竞争,并强化了英伟达作为AI行业大规模基础设施建设核心提供商的角色。