Lợi thế hiệu suất suy luận gấp 20 lần của MiniMax M3 không thể duy trì đà tăng buổi sáng, khi cổ phiếu MINIMAX-W đảo chiều 17 điểm phần trăm để đóng cửa trong sắc đỏ.
Lợi thế hiệu suất suy luận gấp 20 lần của MiniMax M3 không thể duy trì đà tăng buổi sáng, khi cổ phiếu MINIMAX-W đảo chiều 17 điểm phần trăm để đóng cửa trong sắc đỏ.

Lợi thế hiệu suất suy luận gấp 20 lần của MiniMax M3 không thể duy trì đà tăng buổi sáng, khi cổ phiếu MINIMAX-W đảo chiều 17 điểm phần trăm để đóng cửa trong sắc đỏ.
MiniMax M3, một mô hình tổng quát mới với cửa sổ ngữ cảnh 1 triệu token và hiệu suất suy luận gấp 20 lần, đã ra mắt hôm thứ Hai khi cổ phiếu của công ty mẹ MINIMAX-W dao động từ mức tăng 5,2% xuống còn giảm 12%.
Mô hình này sử dụng kiến trúc chú ý thưa thớt mới được phát triển có tên MiniMax Sparse Attention, giúp giảm khối lượng tính toán trên mỗi token xuống còn khoảng một phần hai mươi so với thế hệ trước, công ty cho biết. "M3 đạt được những bước đột phá mang tính thế hệ trong lập trình, khả năng tác nhân, xử lý ngữ cảnh siêu dài và đa phương thức bản địa," MiniMax cho biết trong một tuyên bố.
Cửa sổ ngữ cảnh 1 triệu token cho phép mô hình xử lý toàn bộ mã nguồn hoặc tài liệu dài trong một lần duy nhất, một khả năng cạnh tranh trực tiếp với các sản phẩm từ DeepSeek và các phòng thí nghiệm AI khác của Trung Quốc. Lợi thế hiệu suất đồng nghĩa với việc mỗi truy vấn suy luận chỉ tiêu tốn khoảng 5% sức mạnh tính toán so với mô hình trước đó, một chỉ số ảnh hưởng trực tiếp đến kinh tế học của việc triển khai AI ở quy mô lớn cho khách hàng doanh nghiệp. Hầu hết các mô hình ngôn ngữ lớn hiện nay đều tính phí trên mỗi token cho quyền truy cập API, khiến chi phí suy luận trở thành yếu tố cạnh tranh khác biệt chính.
MINIMAX-W mở cửa tăng 5,24% lên 907,5 HKD trước khi đảo chiều đóng cửa ở mức 736 HKD, giảm 12,38% so với phiên trước đó. Hơn 1,8 triệu cổ phiếu đã được giao dịch, trị giá 1,49 tỷ HKD. Bán khống đạt 110,98 triệu USD, chiếm 5,18% doanh số, theo dữ liệu sàn giao dịch.
Sự đảo chiều mạnh cho thấy các nhà đầu tư đang cân nhắc triển vọng của công nghệ này so với lộ trình tạo doanh thu. UBS cho biết các nâng cấp mô hình có thể đẩy nhanh quá trình kiếm tiền, mặc dù lợi nhuận ngắn hạn vẫn chưa được chứng minh đối với startup AI này, công ty đã niêm yết tại Hồng Kông hồi đầu năm. Cải thiện hiệu suất gấp 20 lần của M3 có thể giảm đáng kể chi phí suy luận, một yếu tố then chốt trong cuộc đua cạnh tranh giữa các nhà phát triển AI Trung Quốc nhằm thu hút khách hàng doanh nghiệp từ những đối thủ kỳ cựu như Ernie của Baidu và Qwen của Alibaba.
MINIMAX-W đang được giao dịch ở mức định giá phản ánh kỳ vọng tăng trưởng cao nhưng khả năng hiện thực hóa doanh thu còn hạn chế, một động thái phổ biến đối với các công ty AI chưa có lợi nhuận. Sự đảo chiều trong ngày của cổ phiếu — mức dao động 17 điểm phần trăm từ đỉnh xuống đáy — cho thấy ngay cả một đột phá công nghệ thực sự cũng có thể không đủ để duy trì đà tăng trong một thị trường đang đòi hỏi kết quả ngắn hạn.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.