英特尔、SambaNova与富士通正携手打造生产就绪的机架级方案,将AI推理任务分散至三种芯片架构上运行。
英特尔、SambaNova与富士通正携手打造生产就绪的机架级方案,将AI推理任务分散至三种芯片架构上运行。

英特尔、SambaNova与富士通正携手打造生产就绪的机架级方案,将AI推理任务分散至三种芯片架构上运行。
英特尔周一在台北Computex 2026上展示了一套解耦推理系统,将AI推理的预填充(pre-filling)和解码(decoding)阶段分离至不同的处理器上执行。该系统由英特尔的Vector Core Compute数据中心平台提供算力,并由其Xeon 6处理器负责编排,解码环节采用SambaNova的SN40 RDU,预填充环节则使用Nvidia的Blackwell GPU。全球最大的电子制造商富士通提供了系统集成支持,并在展会上展示了生产就绪的机架产品。
"这种架构让客户能够独立优化推理的每个阶段,而不是将一切强塞进单一的GPU流水线,"一位英特尔代表在会上表示。该方案直指当前AI部署中的结构性低效问题:预填充——即处理用户提示词的计算密集型第一环节——和解码——即逐token生成响应的环节——对硬件的要求截然不同,单一芯片类型无法高效满足。
这种解耦模式解决了企业在生产环境下运行大语言模型时日益凸显的痛点。预填充需要高内存带宽和矩阵计算能力,这正是Nvidia H100和Blackwell GPU的强项。而解码对延迟更敏感,更受益于SambaNova RDU(可重构数据流单元)的专用数据流架构。通过拆分工作负载,英特尔的Xeon 6扮演编排者角色,将每个阶段路由至最优处理器。
英特尔还发布了Xeon 6+处理器系列以及用于解耦推理的代理云服务(agent cloud services),进一步推进其在AI数据中心市场的布局。目前,Nvidia在该领域的训练和推理芯片收入中占据了约八成的份额。与估值在2024年融资轮后超过五十亿美元的SambaNova以及富士通的合作,为英特尔带来了能够交付完整机架产品(而非仅仅芯片)的制造和集成伙伴。
这一时机颇具战略意义。Nvidia在周一自己的Computex主题演讲中发布了其首款消费级PC处理器RTX Spark Superchip,并确认其Vera Rubin数据中心平台已进入全面生产阶段。Nvidia最近一个财季的数据中心收入达到三百五十六亿美元,远超英特尔数据中心和AI业务板块的四十一亿美元。但英特尔押注异构推理——在单一工作负载中使用多种芯片类型——为企业提供了差异化的价值主张,让那些希望避免被Nvidia CUDA生态完全锁定的客户有了新选择。
对于投资者而言,问题在于英特尔能否将这一架构转化为收入。英特尔最近一个财季的数据中心和AI收入同比下降了8%,公司在AI计算领域流失给Nvidia和AMD的市场份额一直难以收复。与富士通的合作为量产提供了路径:这家代工制造商具备大规模集成、测试和出货完整机架的能力,有望加速企业级应用。英特尔股价年初至今已上涨约200%,反映出市场对其扭亏为盈的乐观情绪,但该公司估值仍较Nvidia 35倍的远期市盈率存在折价。
本文仅供信息参考,不构成投资建议。