0G, hợp tác với China Mobile, đã huấn luyện một mô hình AI 107 tỷ tham số sử dụng hạ tầng phi tập trung, đánh dấu lần đầu tiên một mô hình trên 100 tỷ tham số được phát triển mà không cần các cụm trung tâm dữ liệu tập trung.
"Huấn luyện phi tập trung ở quy mô này chứng minh rằng phát triển mô hình lớn không còn yêu cầu quyền truy cập độc quyền vào các trang trại GPU siêu quy mô," Michael Heinrich, đồng sáng lập của 0G Labs, cho biết. "Các nhà cung cấp viễn thông đang có năng lực tính toán chưa được sử dụng hết giờ đây có thể tham gia vào chuỗi cung ứng AI."
Mô hình được huấn luyện bằng khung huấn luyện phi tập trung của 0G, tích hợp phương pháp DiLoCoX — một kỹ thuật có thể huấn luyện mô hình nhanh hơn tới 357 lần so với các phương pháp phi tập trung trước đây, ngay cả trên các mạng có băng thông chỉ một gigabyte, theo nghiên cứu từ 0G Labs. Bằng cách phân phối tải tính toán trên hạ tầng hiện có của China Mobile thay vì một trung tâm dữ liệu duy nhất, dự án đã vượt qua nút thắt truyền thống của các cụm GPU tập trung vốn đã giới hạn phát triển AI trong tay một số ít nhà cung cấp siêu quy mô.
Tại sao huấn luyện phi tập trung quan trọng đối với AI doanh nghiệp
Thành tựu này giải quyết một vấn đề cấu trúc trong ngành AI: huấn luyện các mô hình lớn đòi hỏi chi tiêu vốn khổng lồ ban đầu cho các cụm GPU, loại bỏ tất cả trừ những công ty công nghệ giàu có nhất. Huấn luyện phi tập trung đảo ngược mô hình đó bằng cách coi bất kỳ tài nguyên tính toán nào kết nối mạng đều là một nút huấn luyện tiềm năng. Đối với các nhà khai thác viễn thông như China Mobile, nơi vận hành hạ tầng tính toán rộng lớn nhưng thường nhàn rỗi trên toàn mạng lưới, điều này tạo ra một nguồn doanh thu mới từ các tài sản hiện có.
Cách tiếp cận này cũng giảm sự phụ thuộc vào GPU H100 và B200 của Nvidia, vốn đang đối mặt với các hạn chế về nguồn cung và kiểm soát xuất khẩu. Bằng cách tổng hợp các tài nguyên tính toán không đồng nhất trên một mạng phân tán, khung của 0G có thể huấn luyện mô hình sử dụng nhiều loại phần cứng khác nhau thay vì yêu cầu các cụm GPU đồng nhất. Điều này có thể giảm áp lực lên thị trường GPU trung tâm dữ liệu trị giá 200 tỷ USD, nơi thời gian chờ đợi cho các chip mới nhất của Nvidia đã kéo dài hơn 12 tháng.
Tuy nhiên, sự sẵn sàng của dữ liệu vẫn là một rào cản. Gartner ước tính rằng có tới 60% dự án AI có thể bị từ bỏ vào năm 2026 do dữ liệu bị phân mảnh hoặc cô lập, một vấn đề mà huấn luyện phi tập trung một mình không giải quyết được. Các doanh nghiệp muốn áp dụng cách tiếp cận này trước tiên phải thống nhất hạ tầng dữ liệu của mình trước khi hưởng lợi từ tính toán phân tán.
Tác động cạnh tranh đối với hệ thống hạ tầng AI
Cột mốc của 0G-China Mobile thách thức mô hình huấn luyện tập trung được Nvidia và các nhà cung cấp đám mây lớn ủng hộ. Nếu huấn luyện phi tập trung được chấp nhận rộng rãi, nó có thể chuyển dịch mô hình mua sắm khỏi các dịch vụ GPU-dưới-dạng-dịch-vụ siêu quy mô sang một thị trường phân mảnh hơn, nơi các nhà khai thác viễn thông và nhà cung cấp biên kiếm tiền từ dung lượng dư thừa.
Bittensor và Render Network, hai dự án token hóa tài nguyên tính toán, có thể chứng kiến nhu cầu gia tăng khi các doanh nghiệp khám phá các giải pháp thay thế phi tập trung. Khả năng huấn luyện mô hình trên hạ tầng phân tán cũng phù hợp với áp lực quản lý ngày càng tăng tại các khu vực như Liên minh châu Âu và Trung Quốc, nơi các yêu cầu về quyền sở hữu dữ liệu khiến việc huấn luyện xuyên biên giới tập trung trở nên khó khăn.
Đối với các nhà đầu tư, sự phát triển này giới thiệu một biến số mới vào luận điểm hạ tầng AI. Doanh thu trung tâm dữ liệu của Nvidia, đạt 47,5 tỷ USD trong năm tài chính gần nhất, được xây dựng trên giả định rằng huấn luyện mô hình lớn đòi hỏi các cụm GPU tập trung. Nếu các phương pháp phi tập trung được chứng minh khả thi ở quy mô lớn, tổng thị trường có thể tiếp cận cho tính toán AI tập trung có thể thu hẹp lại, mang lại lợi ích cho các nhà cung cấp hạ tầng có thể tổng hợp tài nguyên phân tán.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.