Kiến trúc CPU của Arm hiện đang chiếm khoảng 50% khối lượng tính toán tại các hyperscaler, một sự thay đổi mang tính cấu trúc đã được xác nhận tại Computex 2026, khi AMD bước vào sản xuất hàng loạt bộ xử lý máy chủ 2nm đầu tiên của ngành và Intel chính thức ra mắt Xeon 6+ trên tiến trình 18A.
"Sự tái phát minh này của máy tính cũng quan trọng như sự tái phát minh điện thoại thành thứ mà chúng ta biết ngày nay là smartphone," Giám đốc điều hành Nvidia Jensen Huang phát biểu tại một cuộc họp báo của Computex, đề cập đến con chip PC RTX Spark mới của công ty được đồng phát triển với MediaTek.
Thị phần hyperscaler của Arm đứng ở mức khoảng 18% vào giữa năm 2024 trước khi nén xuống còn 50% trong khoảng hai năm, trùng với thời điểm ngành công nghiệp chuyển hướng sang đầu tư cơ sở hạ tầng AI. Amazon Web Services tiết lộ rằng mảng kinh doanh silicon tùy chỉnh của họ — bao gồm CPU Graviton dựa trên Arm cùng với bộ tăng tốc AI Trainium và chip mạng Nitro — đã vượt qua mức doanh thu hàng năm 20 tỷ đô la, tăng trưởng với tốc độ ba chữ số so với cùng kỳ năm trước. Google công bố rằng các thế hệ TPU tiếp theo sẽ thay thế bộ xử lý chủ x86 bằng CPU Axion tùy chỉnh dựa trên Arm, mang lại hiệu năng trên mỗi watt tốt hơn tới 2 lần so với thế hệ dựa trên x86 trước đó. Microsoft tiếp tục thúc đẩy chiến lược CPU Cobalt dựa trên Arm, hiện đã được triển khai trên khắp các khu vực Azure và cung cấp năng lượng cho các khối lượng công việc sản xuất của các khách hàng bao gồm Databricks, Siemens và Snowflake.
Đối với thị trường điện toán đám mây trị giá 200 tỷ đô la, hàm ý rất trực tiếp: các doanh nghiệp hiện chọn giữa các kiến trúc, không chỉ giữa các nhà cung cấp. Cổ phiếu Nvidia tăng hơn 6% vào thứ Hai sau khi công bố RTX Spark, trong khi Intel giảm khoảng 6% và AMD giảm khoảng 5% khi các nhà đầu tư định giá sự tham gia của Nvidia vào thị trường bộ xử lý PC mà hai công ty này đã cùng kiểm soát trong bốn thập kỷ.
AMD Venice 2nm ra mắt đầu tiên
AMD bước vào Computex với một thành tích mà chưa đối thủ nào có thể sánh kịp. EPYC "Venice," bộ xử lý máy chủ thế hệ thứ sáu của công ty, đã bước vào sản xuất hàng loạt quy mô lớn trên tiến trình 2nm của TSMC — đây là sản phẩm điện toán hiệu năng cao đầu tiên trong ngành đạt được tiến trình này. Tiến trình 2nm chứa nhiều bóng bán dẫn hơn trên mỗi milimet vuông, cải thiện hiệu năng trên mỗi watt đồng thời giảm kích thước die.
Băng thông bộ nhớ trên mỗi socket tăng hơn gấp đôi lên 1,6 TB/s, từ 614 GB/s trên thế hệ trước, trong khi băng thông CPU-GPU được tăng gấp 2 lần — những con số giải quyết trực tiếp nút thắt cổ chai băng thông bộ nhớ trong các khối lượng công việc suy luận và huấn luyện AI. Cấu hình hàng đầu mở rộng lên 256 lõi mỗi socket, với hiệu năng được tuyên bố cải thiện 70% so với thế hệ EPYC trước. Nền tảng rack-scale Helios của AMD, kết hợp CPU Venice với GPU Instinct MI450X, đang đi đúng hướng cho các triển khai đa gigawatt trong nửa cuối năm 2026.
Venice không đến mà không có rủi ro chuỗi cung ứng. Việc sản xuất của AMD chia sẻ công suất N2 của TSMC với Apple, công ty đã bảo đảm khoảng một nửa sản lượng 2nm có sẵn của TSMC cho bộ xử lý iPhone 18 A20 và chip dòng M, cùng với Qualcomm, Nvidia và MediaTek. Các đội ngũ thu mua hyperscaler tại Đài Bắc đang theo dõi chặt chẽ động thái phân bổ wafer 2nm trong tuần này; nguồn cung, chứ không phải thông số kỹ thuật, có thể quyết định người mua nào được tiếp cận Venice trước tiên.
Câu trả lời 18A của Intel và tham vọng PC của Nvidia
Intel đến với câu trả lời trực tiếp nhất từ trước đến nay cho thách thức từ Arm và AMD. Dòng Xeon 6+ — có tên mã là Clearwater Forest — đưa tiến trình 18A của Intel vào phần cứng máy chủ thương mại lần đầu tiên. Xeon 6990E+ hàng đầu chứa 288 lõi hiệu quả Darkmont trong một socket duy nhất, với 576 MB bộ nhớ đệm L3 và hỗ trợ bộ nhớ DDR5-8000 12 kênh, đồng thời có sẵn ngay lập tức thông qua Dell Technologies, Hewlett Packard Enterprise, Lenovo và Supermicro.
Intel tuyên bố 6990E+ mang lại hiệu năng trung bình trên mỗi luồng cao hơn 30% so với EPYC 9965 192 lõi của AMD. Sự so sánh đó nhắm vào một con chip mà lộ trình Venice của AMD sẽ thay thế trước khi hầu hết các chu kỳ nâng cấp doanh nghiệp hoàn tất. Nish Neelalojanan, Giám đốc Cao cấp về Quản lý Sản phẩm của Nhóm Điện toán Khách hàng tại Intel, đã thừa nhận áp lực cạnh tranh từ RTX Spark của Nvidia một cách thẳng thắn tại một cuộc họp bàn tròn truyền thông của Computex, nói rằng Intel đang xử lý thách thức với "một liều hoang tưởng lành mạnh" đồng thời chỉ ra hào lũy tương thích phần mềm x86.
Siêu chip RTX Spark của Nvidia, được đồng phát triển với Microsoft và MediaTek, kết hợp 20 lõi CPU Arm với GPU lớp Blackwell mang 6.144 lõi CUDA, 128 GB bộ nhớ hợp nhất LPDDR5x và mục tiêu tính toán AI được công bố là 1 petaflop. Nvidia cam kết một lộ trình đa thế hệ, phác thảo các thế hệ chip trong tương lai cho hệ thống máy tính xách tay và máy tính để bàn. Các đối tác OEM ra mắt đã được xác nhận bao gồm Microsoft, Dell, HP, ASUS, Lenovo và MSI, với các thiết bị tiêu dùng dự kiến ra mắt vào mùa thu này. Morgan Stanley ước tính lượng xuất xưởng chip RTX Spark từ 5 triệu đến 8 triệu đơn vị trong năm 2026, với các thiết bị cao cấp có giá 2.899 USD cho biến thể N1X và 1.799 USD cho N1.
Mối đe dọa cạnh tranh đi kèm với những hạn chế thực tế. Windows trên Arm vẫn phải đối mặt với những khoảng trống đã được ghi nhận trong hỗ trợ phần mềm chống gian lận, phạm vi hỗ trợ trình điều khiển ngoại vi và khả năng tương thích ứng dụng chuyên nghiệp cụ thể — những vấn đề mà Neelalojanan của Intel đã trích dẫn trực tiếp tại Computex. Nvidia và Microsoft đã hứa hẹn một chương trình chứng nhận tương thích, nhưng chưa có dữ liệu thử nghiệm của bên thứ ba nào trước khi có một sản phẩm chưa được xuất xưởng.
Ý nghĩa của sự thay đổi đối với nhà đầu tư
Chi phí phát triển chip tại các tiến trình tiên tiến — từ 200 triệu đô la đến gần 1 tỷ đô la ở tiến trình 3nm và 2nm, với thời gian phát triển từ ba đến năm năm — khiến đây trở thành một sự thay đổi mang tính cấu trúc, không phải là mang tính chu kỳ. Các hyperscaler đã cam kết nguồn lực kỹ thuật cho silicon Arm tùy chỉnh sẽ không quay đầu. AWS Graviton, Google Axion và Microsoft Cobalt đại diện cho các khoản đầu tư vốn không thể chuyển hướng nếu không có hậu quả kéo dài nhiều năm.
Mỗi điểm phần trăm thị phần tính toán CPU mà Arm giành được từ x86 đại diện cho doanh thu bị dịch chuyển trong một thị trường tạo ra hàng trăm tỷ đô la hàng năm. Đối với Intel và AMD, câu hỏi không còn là liệu sự thống trị trung tâm dữ liệu của x86 có đang bị thách thức hay không — mà là tốc độ sàn đang di chuyển nhanh như thế nào, và liệu lộ trình hiệu năng trên mỗi watt và tiến trình của họ có thể làm chậm tốc độ dịch chuyển hay không. Trong khi đó, Nvidia đã xác nhận rằng họ đã bảo đảm đủ công suất TSMC để hỗ trợ tăng trưởng đến năm 2027, với Huang tuyên bố rằng công ty vẫn kỳ vọng nguồn cung sẽ bị thắt chặt khi nhu cầu vượt quá khả năng bổ sung công suất.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.