DeepSeek sẽ ra mắt phiên bản chính thức V4 vào giữa tháng 7 với giá API giờ cao điểm được đặt ở mức gấp đôi giá thông thường.
Phiên bản chính thức V4 của DeepSeek, ra mắt vào giữa tháng 7, sẽ tính phí khách hàng gấp đôi trong giờ cao điểm — một chiến lược định giá dựa trên lợi thế chi phí hiện có của phòng thí nghiệm Trung Quốc này so với Anthropic và OpenAI.
"Định giá theo giờ cao điểm-thấp điểm cho phép chúng tôi phân bổ năng lực tính toán hiệu quả hơn trong các khung giờ có nhu cầu cao," một phát ngôn viên của DeepSeek cho biết, mà không tiết lộ mức giá cơ bản trên mỗi token cho bản phát hành chính thức.
Giờ cao điểm chạy từ 9 giờ sáng đến 12 giờ trưa và 2 giờ chiều đến 6 giờ tối hàng ngày, với mức giá gấp 2 lần so với giá ngoài giờ cao điểm. Mô hình V4-Pro, kích hoạt 49 tỷ trong tổng số 1,6 nghìn tỷ tham số mỗi lượt xử lý forward, đã có chi phí bằng khoảng 1,5% so với Claude Fable 5 của Anthropic cho các tác vụ tương đương, theo chuyên gia phân tích Jim Reid của Deutsche Bank.
Động thái định giá này diễn ra sau khi DeepSeek phát hành DSpark vào ngày 27 tháng 6, một khung giải mã suy diễn (speculative decoding) giúp tăng tốc độ sinh của V4-Flash lên tới 85% mà không cần nâng cấp phần cứng. Đối với các doanh nghiệp vận hành V4 ở quy mô lớn, suy luận nhanh hơn kết hợp với định giá phân tầng có thể giảm thêm chi phí trên mỗi token — gây áp lực lên biên lợi nhuận của các nhà cung cấp mô hình Mỹ trước thềm các đợt IPO được kỳ vọng.
Việc ra mắt phiên bản chính thức khép lại giai đoạn lặp lại nhanh chóng. Khung DSpark của DeepSeek đã cải thiện tốc độ sinh trên mỗi người dùng từ 60% đến 85% trên V4-Flash và từ 57% đến 78% trên V4-Pro so với đường cơ sở MTP-1 trước đó, theo dữ liệu sản xuất nội bộ. Công ty cũng mã nguồn mở DeepSpec, toàn bộ ngăn xếp đào tạo cho các mô hình giải mã suy diễn, theo giấy phép MIT — giúp công nghệ này có sẵn cho các nhóm sử dụng mô hình Qwen3 và Gemma.
Các Phòng Thí Nghiệm AI Trung Quốc Thắt Chặt Vòng Vây Giá
DeepSeek không đơn độc trong việc thách thức định giá của Mỹ. Z.ai, trước đây là Zhipu AI, đã ra mắt GLM5.2 trong tuần này — một mô hình mà chiến lược gia Christopher Wood của Jefferies gọi là "gần như ngang bằng với Anthropic với tư cách là đối thủ cạnh tranh cho thị trường doanh nghiệp" với chi phí chỉ bằng một phần tư mỗi token. Các nhà giao dịch của Morgan Stanley lưu ý rằng "cơ cấu nhu cầu đang rõ ràng chuyển dịch sang các mô hình chi phí thấp hơn."
Cơ chế giờ cao điểm-thấp điểm có thể mở rộng khoảng cách chi phí của DeepSeek hơn nữa trong giờ thấp điểm, khi giá giảm xuống còn một nửa mức giờ cao điểm. Đối với khoảng 90% các tác vụ hàng ngày, V4-Pro của DeepSeek "làm công việc tương tự với chi phí chỉ bằng khoảng 1,5%" so với Claude Fable 5 của Anthropic, Reid của Deutsche Bank đã viết vào ngày 18 tháng 6.
Điều Này Có Ý Nghĩa Gì Đối Với Nhà Đầu Tư
Sự dịch chuyển sang các mô hình rẻ hơn đe dọa các câu chuyện định giá của các nhà cung cấp AI Mỹ đang lên kế hoạch niêm yết công khai. OpenAI được cho là đang xem xét lại lộ trình IPO do hiệu suất kém của các đợt IPO công nghệ và áp lực cạnh tranh về giá ngày càng tăng, theo New York Times đưa tin. Anthropic cũng đối mặt với áp lực tương tự khi khách hàng doanh nghiệp đánh giá các lựa chọn thay thế chi phí thấp hơn.
Đối với các nhà sản xuất GPU và nhà cung cấp đám mây, xu hướng này mang tính hai mặt. Chi phí trên mỗi token thấp hơn có thể thúc đẩy áp dụng rộng rãi hơn — Deloitte dự báo khối lượng công việc suy luận sẽ chiếm khoảng hai phần ba tổng khối lượng tính toán AI vào năm 2026, tăng từ một phần ba vào năm 2023. Nhưng nếu các doanh nghiệp chuyển khối lượng công việc sang các mô hình rẻ hơn hoặc tự lưu trữ, tăng trưởng doanh thu tại các nhà cung cấp đám mây siêu quy mô có thể chậm lại. Định giá giờ cao điểm-thấp điểm của DeepSeek đánh dấu một giai đoạn mới trong cuộc chiến giá AI, nơi các phòng thí nghiệm Trung Quốc sử dụng tối ưu hóa phần mềm và định giá mạnh mẽ để giành thị phần từ các đối thủ Mỹ đang nắm giữ.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.