Nghịch lý giá AI: chi phí phần cứng thượng nguồn đang tăng vọt trong khi giá token hạ nguồn sụp đổ — và cả hai xu hướng đều đang gia tốc.
Nghịch lý giá AI: chi phí phần cứng thượng nguồn đang tăng vọt trong khi giá token hạ nguồn sụp đổ — và cả hai xu hướng đều đang gia tốc.

Ngành công nghiệp AI đang trải qua một sự phân hóa giá mang tính cấu trúc hiếm thấy: chi phí phần cứng thượng nguồn tăng vọt trong khi giá token hạ nguồn sụp đổ, với cả hai xu hướng đều đang gia tốc trong nửa đầu năm 2026.
"Chuỗi công nghiệp AI đang trải qua sự phân hóa giá mang tính cấu trúc — giá tài nguyên tính toán thượng nguồn đối mặt với lạm phát do cung thắt chặt trong khi giá tiêu thụ token hạ nguồn đối mặt với giảm phát do cạnh tranh," Zhang Xia, chiến lược gia tại China Merchants Securities, viết trong báo cáo ngày 15/6.
Sự phân hóa rất rõ rệt. Vonfram hexaflorua, vật liệu chủ chốt cho khắc bán dẫn, đã tăng vọt lên 1.670-1.810 nhân dân tệ/kg, tăng 232,7% so với 523 nhân dân tệ một năm trước, sau khi các nhà cung cấp Hàn Quốc thông báo cho Samsung và SK Hynix về mức tăng giá hợp đồng 70%-90% cho năm 2026. Bộ nhớ, CPU và mô-đun quang cũng đang kéo dài xu hướng tăng khi chi tiêu vốn của các hyperscaler tăng tốc — dự kiến đạt 757 tỷ đô la vào năm 2026 và 920 tỷ đô la vào năm 2027, tăng từ 448 tỷ đô la vào năm 2025, theo ước tính của ngành.
Câu hỏi mà các nhà đầu tư đang đặt ra: liệu khối lượng tiêu thụ token bùng nổ có thể bù đắp đủ cho mức giảm giá để duy trì tăng trưởng doanh thu toàn ngành hay không?
Ràng buộc nguồn cung thúc đẩy lạm phát thượng nguồn
Sự tăng giá thượng nguồn bắt nguồn trực tiếp từ sự mất cân bằng cung-cầu chưa có dấu hiệu hạ nhiệt. Chi tiêu vốn của hyperscaler đã tăng hơn gấp bốn lần từ 162 tỷ đô la vào năm 2022 lên mức dự kiến 757 tỷ đô la vào năm 2026, nhưng năng lực sản xuất thượng nguồn cần nhiều năm mới có thể đưa vào vận hành. Samsung và SK Hynix đều cho biết trong các cuộc gọi thu nhập tháng 4-5/2026 rằng tình trạng thiếu hụt bộ nhớ do AI sẽ kéo dài đến năm 2027 và xa hơn, với các khách hàng cốt lõi đã đặt trước năng lực cho năm 2027.
Kế hoạch cơ sở hạ tầng dữ liệu trị giá 2 nghìn tỷ nhân dân tệ của Trung Quốc, được công bố vào tháng 1/2025, bổ sung thêm một lớp nhu cầu khác. Kế hoạch yêu cầu ít nhất 80% chip AI phải đến từ các nhà cung cấp nội địa như Huawei và Cambricon, loại trừ Nvidia và AMD. Trong tổng đầu tư, khoảng 780 tỷ nhân dân tệ — tương đương 39% — sẽ chảy vào chip GPU, khiến đây là đối tượng hưởng lợi lớn nhất. Thiết bị điện và phân phối điện chiếm 21%, tương đương 420 tỷ nhân dân tệ, trong khi mô-đun quang, switch và làm mát mỗi loại chiếm khoảng 4%.
Các nhà sản xuất chip nội địa đang giành thị phần. Thị phần chip AI Trung Quốc đã vượt 52% trong nửa đầu năm 2026, tăng từ 41% năm 2025 và lần đầu tiên vượt qua Nvidia. Dòng Ascend của Huawei dẫn đầu với 812.000 đơn vị xuất xưởng trong năm 2025, gần một nửa tổng số chip nội địa, tiếp theo là Pingtouge của Alibaba với 265.000 đơn vị và Baidu Kunlun cùng Cambricon với khoảng 116.000 đơn vị mỗi loại.
Giảm phát token và nghịch lý Jevons
Ở hạ nguồn, bức tranh giá hoàn toàn khác biệt. OpenAI đang xem xét cắt giảm giá token đáng kể để đối phó với chiến lược định giá mạnh tay của Anthropic, trong khi Tencent Cloud đã giảm giá đầu vào tới 66,67%. Claude Fable 5 của Anthropic, phát hành ngày 9/6, vượt trội hơn tất cả các mô hình công khai trước đây trong các tác vụ phức tạp, ngữ cảnh dài nhưng có giá chỉ 10 đô la cho mỗi triệu token đầu vào và 50 đô la cho mỗi triệu token đầu ra — chưa bằng một nửa chi phí của phiên bản tiền nhiệm Mythos Preview.
Chỉ số Chi tiêu Token LLM của Silicon Data, theo dõi tổng chi tiêu token thị trường, ghi nhận mức giảm đáng kể đầu tiên kể từ tháng 2 khi các doanh nghiệp trì hoãn mua hàng để chờ giá giảm thêm.
Nhưng tổng tiêu thụ đang bùng nổ. Số lượng token toàn cầu hàng tuần đạt 36,1 nghìn tỷ tính đến ngày 8/6, theo dữ liệu của OpenRouter, và tiếp tục tăng theo cấp số nhân. Tại Trung Quốc, người dùng AI tạo sinh tăng từ 249 triệu vào cuối năm 2024 lên 515 triệu vào giữa năm 2025 — gần như tăng gấp đôi — trong khi tiêu thụ token hàng ngày tăng vọt từ khoảng 100 tỷ lên 1,4 nghìn tỷ trong cùng kỳ, mức tăng gấp 14 lần. Khoảng cách giữa tăng trưởng người dùng và tăng trưởng tiêu thụ cho thấy động lực không phải là người dùng mới mà là mức độ tương tác sâu hơn trên mỗi người dùng và sự thâm nhập nhanh chóng của các ứng dụng dựa trên tác nhân.
Đây chính là nghịch lý Jevons đang hoạt động: khi chi phí của một nguồn tài nguyên giảm, tổng nhu cầu tăng lên — thường đủ để làm tăng tổng chi tiêu. Điều này đã xảy ra với than đá, điện năng và băng thông. Câu hỏi đặt ra là liệu kinh tế học token có đi theo cùng một mô hình hay không.
Ý nghĩa đầu tư
Đối với các nhà đầu tư, sự phân hóa tạo ra hai cơ hội giao dịch riêng biệt. Các nhà cung cấp phần cứng thượng nguồn — nhà sản xuất chip, bộ nhớ, mô-đun quang và thiết bị điện — được hưởng lợi từ các ràng buộc cung mang tính cấu trúc và nhu cầu do chính sách thúc đẩy có khả năng kéo dài ít nhất đến năm 2027. Kế hoạch cơ sở hạ tầng trị giá 2 nghìn tỷ nhân dân tệ của Trung Quốc ưu tiên chip nội địa hơn Nvidia và AMD là một xu hướng thế tục kéo dài nhiều năm, định hình lại động lực cạnh tranh tại thị trường AI lớn thứ hai thế giới.
Ở hạ nguồn, bức tranh phức tạp hơn. Các công ty có thể khai thác khối lượng token bùng nổ — các nhà cung cấp mô hình như DeepSeek và Hunyuan của Tencent, nằm trong số các mô hình được gọi nhiều nhất toàn cầu — có thể bù đắp áp lực giảm giá thông qua quy mô. Các mô hình nguồn mở hiện chiếm gần một phần ba tổng lượng token sử dụng, với các nhà phát triển thay thế DeepSeek và Qwen của Alibaba cho một số API mã nguồn đóng.
Lĩnh vực điện năng và lưu trữ năng lượng cũng nổi lên như những người hưởng lợi gián tiếp. Trung tâm dữ liệu AI của Trung Quốc tiêu thụ 196 tỷ kilowatt-giờ trong năm 2025, và Cục Năng lượng Quốc gia dự báo con số này sẽ đạt 800 tỷ kilowatt-giờ vào năm 2030, tương đương khoảng 6% tổng tiêu thụ điện quốc gia. Công suất lưu trữ năng lượng lắp đặt đạt 136 triệu kilowatt vào cuối năm 2025, tăng 84% so với cùng kỳ năm trước, với cơ sở hạ tầng AI trở thành động lực nhu cầu mới đáng kể.
Rủi ro chính là liệu tăng trưởng nhu cầu token hạ nguồn có thể duy trì quỹ đạo theo cấp số nhân hay không. Nếu nghịch lý Jevons đúng, tổng doanh thu ngành sẽ tăng trưởng. Nếu mức giảm giá vượt qua tăng trưởng khối lượng, biên lợi nhuận tầng ứng dụng sẽ chịu áp lực kéo dài. Hai quý báo cáo thu nhập tiếp theo của các hyperscaler sẽ cung cấp bài kiểm tra thực tế đầu tiên.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.