Xiaomi đã phát hành một bộ đôi mô hình AI mã nguồn mở thách thức hiệu quả sử dụng token của các hệ thống hàng đầu từ OpenAI và Google, báo hiệu một sự thay đổi lớn trong kinh tế học của AI tác nhân.
Công ty công nghệ Trung Quốc Xiaomi đã phát hành hai mô hình AI mã nguồn mở, MiMo-V2.5 và V2.5-Pro, tiêu thụ ít hơn tới 60% token so với các mô hình từ OpenAI và Google cho các tác vụ tác nhân phức tạp. Mô hình chủ lực MiMo-V2.5-Pro, được phát hành theo giấy phép MIT cho phép, nhằm mục đích giảm chi phí phát triển AI khi ngành công nghiệp chuyển sang mô hình định giá dựa trên mức sử dụng.
"Giá trị của một mô hình không chỉ được đo bằng bảng xếp hạng — nó được đo bằng những vấn đề mà nó giải quyết được," Fuli Luo, trưởng dự án Xiaomi MiMo và là cựu thành viên của nhóm DeepSeek, cho biết trên nền tảng mạng xã hội X.
Theo các điểm chuẩn do Xiaomi công bố, MiMo-V2.5-Pro đạt tỷ lệ thành công 63,8% trên điểm chuẩn ClawEval trong khi chỉ tiêu thụ khoảng 70.000 token. Con số này thấp hơn 40-60% so với mức yêu cầu của Claude Opus 4.6 của Anthropic, Gemini 3.1 Pro của Google và GPT-5.4 của OpenAI cho các kết quả tương tự. Mô hình này được cung cấp thông qua API với mức giá cạnh tranh là 1,00 USD cho mỗi triệu token đầu vào.
Việc ra mắt trực tiếp thách thức mô hình kinh tế của các công ty dẫn đầu về AI mã nguồn đóng như OpenAI, Anthropic và Google bằng cách cung cấp một giải pháp thay thế mã nguồn mở, chi phí thấp hơn. Khi các dịch vụ như GitHub Copilot chuyển sang thanh toán theo lưu lượng sử dụng, hiệu quả cao và giấy phép cởi mở của MiMo có thể thu hút các nhà phát triển và doanh nghiệp đang muốn tránh việc leo thang "thuế SaaS" trên các quy trình làm việc AI.
Hiệu quả thông qua chuyên môn hóa
Cốt lõi của dòng MiMo là kiến trúc Sparse Mixture-of-Experts (MoE). MiMo-V2.5-Pro với 1,02 nghìn tỷ tham số chỉ sử dụng 42 tỷ tham số cho bất kỳ tác vụ cụ thể nào, một thiết kế giúp giảm đáng kể chi phí tính toán. Điều này cho phép mô hình Pro đạt được hiệu suất cao trong các tác vụ "claw" tác nhân — nơi tác nhân AI hoàn thành các quy trình phức tạp thay mặt người dùng — trong khi tiêu thụ ít token hơn đáng kể so với các đối thủ. Trên điểm chuẩn GDPVal-AA, mô hình Pro đạt 1581 điểm, vượt qua các mô hình như GLM 5.1 của Zhipu và Kimi K2.6 của Moonshot.
Xiaomi đã chứng minh sức mạnh của mô hình bằng cách để nó tự động hoàn thành một số dự án phức tạp. V2.5-Pro đã triển khai một trình biên dịch hoàn chỉnh bằng ngôn ngữ lập trình Rust trong 4,3 giờ qua 672 lượt gọi công cụ và tạo ra một ứng dụng chỉnh sửa video dài 8.192 dòng trong 11,5 giờ.
Thách thức mã nguồn mở đối với 'Thuế SaaS'
Bằng cách phát hành các mô hình theo Giấy phép MIT, Xiaomi cho phép bất kỳ nhà phát triển hoặc doanh nghiệp nào sử dụng, sửa đổi và triển khai chúng cho mục đích thương mại mà không bị hạn chế. Động thái này là một thách thức trực tiếp đối với cách tiếp cận "khu vườn khép kín" của nhiều phòng thí nghiệm AI hàng đầu và diễn ra trong bối cảnh mô hình định giá của ngành đang thay đổi. Với việc GitHub Copilot và các dịch vụ khác chuyển từ đăng ký trả phí cố định sang thanh toán dựa trên mức sử dụng, chi phí vận hành các tác nhân AI mạnh mẽ đang trở thành mối quan tâm lớn đối với các doanh nghiệp.
Giá API của Xiaomi tiếp tục phá giá thị trường. MiMo-V2.5-Pro có giá 1,00 USD cho mỗi triệu token đầu vào và 3,00 USD cho đầu ra, so với 2,00 USD và 12,00 USD của Google Gemini 3 Pro hoặc 5,00 USD và 30,00 USD của OpenAI GPT-5.5. Để thúc đẩy việc áp dụng, công ty cũng đã công bố khoản tài trợ 100 nghìn tỷ token miễn phí cho các nhà phát triển.
Sự ra mắt này phản ánh xu hướng rộng lớn hơn của các mô hình mã nguồn mở có năng lực cao từ các công ty Trung Quốc, bao gồm dòng Qwen của Alibaba và GLM của Zhipu AI, đang giành được vị thế trước các đối thủ phương Tây. TIME gần đây đã vinh danh ByteDance, Zhipu AI và Alibaba vào danh sách 10 công ty AI có ảnh hưởng nhất năm 2026, nhấn mạnh tầm ảnh hưởng ngày càng tăng của công nghệ Trung Quốc trong bối cảnh AI toàn cầu. Đối với các doanh nghiệp Hoa Kỳ, việc chạy các mô hình mã nguồn mở này trên các máy chủ riêng tư mang lại một lộ trình tận dụng AI hiệu suất cao, chi phí thấp đồng thời giảm thiểu rủi ro về nơi lưu trú dữ liệu và tuân thủ.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.