Intel, SambaNova và Foxconn đang xây dựng các rack sẵn sàng sản xuất, phân tách suy luận AI trên ba kiến trúc chip.
Intel, SambaNova và Foxconn đang xây dựng các rack sẵn sàng sản xuất, phân tách suy luận AI trên ba kiến trúc chip.

Intel, SambaNova và Foxconn đang xây dựng các rack sẵn sàng sản xuất, phân tách suy luận AI trên ba kiến trúc chip.
Intel đã trình diễn một hệ thống suy luận tách rời tại Computex 2026 ở Đài Bắc hôm thứ Hai, hệ thống này phân tách các giai đoạn tiền xử lý (pre-filling) và giải mã (decoding) của suy luận AI trên các bộ xử lý khác nhau. Hệ thống, được hỗ trợ bởi nền tảng trung tâm dữ liệu Vector Core Compute của Intel và điều phối bởi bộ xử lý Xeon 6, sử dụng SN40 RDU của SambaNova cho giai đoạn giải mã và GPU Blackwell của Nvidia cho giai đoạn tiền xử lý. Foxconn, nhà sản xuất điện tử lớn nhất thế giới, đã cung cấp hỗ trợ tích hợp hệ thống và trưng bày các rack sẵn sàng sản xuất tại triển lãm.
"Kiến trúc này cho phép khách hàng tối ưu hóa từng giai đoạn suy luận một cách độc lập, thay vì buộc mọi thứ phải chạy qua một pipeline GPU duy nhất," một đại diện của Intel phát biểu tại sự kiện. Cách tiếp cận này nhắm vào sự kém hiệu quả về cấu trúc trong các triển khai AI hiện tại: tiền xử lý — quá trình tính toán chuyên sâu đầu tiên xử lý prompt của người dùng — và giải mã — quá trình tạo ra phản hồi từng token — có các yêu cầu phần cứng khác nhau mà một loại chip đơn lẻ không thể đáp ứng một cách hiệu quả.
Mô hình tách rời giải quyết một điểm đau ngày càng lớn đối với các doanh nghiệp đang vận hành các mô hình ngôn ngữ lớn trong sản xuất. Tiền xử lý đòi hỏi băng thông bộ nhớ cao và khả năng tính toán ma trận, nơi các GPU H100 và Blackwell của Nvidia vượt trội. Ngược lại, giải mã nhạy cảm hơn với độ trễ và được hưởng lợi từ kiến trúc luồng dữ liệu chuyên biệt của RDU (bộ xử lý luồng dữ liệu khả cấu hình) của SambaNova. Bằng cách phân tách khối lượng công việc, Xeon 6 của Intel đóng vai trò là bộ điều phối, định tuyến từng giai đoạn đến bộ xử lý tối ưu.
Intel cũng công bố dòng bộ xử lý Xeon 6+ và các dịch vụ đám mây tác nhân (agent cloud services) cho suy luận tách rời, mở rộng nỗ lực thâm nhập thị trường trung tâm dữ liệu AI, nơi Nvidia đã chiếm ước tính khoảng 80% doanh thu chip cho cả đào tạo và suy luận. Quan hệ đối tác với SambaNova — một công ty khởi nghiệp được định giá hơn 5 tỷ đô la Mỹ sau vòng gọi vốn năm 2024 — và Foxconn mang lại cho Intel một đối tác sản xuất và tích hợp có khả năng cung cấp các rack hoàn chỉnh thay vì chỉ chip.
Thời điểm mang tính chiến lược. Nvidia đã sử dụng bài phát biểu quan trọng tại Computex hôm thứ Hai để ra mắt RTX Spark Superchip, bộ xử lý PC tiêu dùng đầu tiên của hãng, và xác nhận rằng nền tảng trung tâm dữ liệu Vera Rubin đã bước vào giai đoạn sản xuất hàng loạt. Doanh thu mảng trung tâm dữ liệu của Nvidia đạt 35,6 tỷ đô la Mỹ trong quý tài chính gần nhất, vượt xa mảng trung tâm dữ liệu và AI của Intel, vốn chỉ đạt 4,1 tỷ đô la Mỹ. Nhưng vụ đặt cược của Intel vào suy luận không đồng nhất (heterogeneous inference) — sử dụng nhiều loại chip trong một khối lượng công việc duy nhất — mang lại một đề xuất giá trị khác biệt cho các doanh nghiệp muốn tránh bị phụ thuộc hoàn toàn vào một nhà cung cấp duy nhất trong hệ sinh thái CUDA của Nvidia.
Đối với các nhà đầu tư, câu hỏi đặt ra là liệu Intel có thể chuyển đổi kiến trúc này thành doanh thu hay không. Doanh thu mảng trung tâm dữ liệu và AI của Intel đã giảm 8% so với cùng kỳ năm ngoái trong quý gần nhất, và công ty đang gặp khó khăn trong việc giành lại thị phần đã mất vào tay Nvidia và AMD trong lĩnh vực tính toán AI. Quan hệ đối tác với Foxconn mở ra một con đường hướng tới sản xuất khối lượng lớn: khả năng tích hợp, kiểm thử và vận chuyển các rack hoàn chỉnh ở quy mô lớn của nhà sản xuất hợp đồng này có thể đẩy nhanh việc áp dụng trong doanh nghiệp. Cổ phiếu Intel đã tăng khoảng 200% từ đầu năm đến nay nhờ sự lạc quan về quá trình xoay chuyển của công ty, nhưng công ty vẫn được giao dịch ở mức chiết khấu so với bội số thu nhập dự phóng 35 lần của Nvidia.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.