DeepSeek V4 cắt giảm 97% chi phí Token AI để thách thức GPT-5.5

Một loạt các đợt cắt giảm giá mạnh mẽ của phòng thí nghiệm AI Trung Quốc DeepSeek đang làm rung chuyển thị trường trí tuệ nhân tạo, với mô hình V4-Pro của họ hiện có giá rẻ hơn tới 35 lần so với GPT-5.5 của OpenAI và thiết lập một mức sàn mới cho chi phí token. Động thái này ít giống như một thách thức trực tiếp đối với các mô hình hàng đầu mà giống như một tín hiệu về giai đoạn tiếp theo của ngành công nghiệp AI, nơi giá cả sụp đổ có thể mở rộng đáng kể nhu cầu tính toán.

"Cứ thoải mái và tận hưởng đi," một nhà nghiên cứu cấp cao của DeepSeek đã đăng trên X khi công ty cắt giảm giá lần thứ ba trong một tuần. Phòng thí nghiệm này lần đầu tiên mở mã nguồn dòng mô hình V4 của mình, sau đó công bố mức chiết khấu khuyến mại 75% và cuối cùng đã giảm 90% giá cho các lượt truy cập bộ nhớ đệm đầu vào, tạo ra một cấu trúc giá làm thay đổi căn bản tính kinh tế đối với các nhà phát triển.

Các con số thật đáng kinh ngạc. DeepSeek V4-Pro, một mô hình Mixture-of-Experts (MoE) với 1,6 nghìn tỷ tham số, hiện có giá khoảng $1,74 cho mỗi triệu token đầu vào và $0,87 cho mỗi triệu token đầu ra với mức giá khuyến mại. Để so sánh, GPT-5.5 tốn khoảng $30,21 cho mỗi triệu token đầu ra và Claude Opus 4.7 của Anthropic tốn $25, theo dữ liệu ngành. Một báo cáo nghiên cứu của CICC ngày 29 tháng 4 lưu ý rằng hiệu quả của dòng V4 sẽ thúc đẩy nhu cầu cho các ứng dụng Agentic AI hạ nguồn, gọi tên Zhipu (02513) và MiniMax là những bên có khả năng hưởng lợi.

Tuy nhiên, cuộc chiến giá cả đã che lấp một thực tế phức tạp hơn về vị thế của Trung Quốc trong cuộc đua AI toàn cầu. Mặc dù mức giá của DeepSeek có tính đột phá, nhưng công nghệ của họ không phải là hàng đầu. Các tài liệu riêng của công ty cho thấy V4 vẫn đứng sau các mô hình như GPT-5.4 và Gemini 3.1-Pro. Trên Chỉ số Trí tuệ Phân tích Nhân tạo độc lập, DeepSeek V4-Pro đạt 52 điểm, kém đáng kể so với 60 điểm của GPT-5.5 và 57 điểm của Claude Opus 4.7.

Đế chế thầm lặng đã chiến thắng

Trong khi DeepSeek chiếm lĩnh các tiêu đề báo, một công ty Trung Quốc khác đã đảm bảo vị trí thống trị trong lĩnh vực AI mã nguồn mở. Dòng mô hình Qwen của Alibaba đã vượt qua 1 tỷ lượt tải xuống tích lũy trên Hugging Face và chỉ riêng trong tháng 2 năm 2026, đã tạo ra nhiều lượt tải xuống hơn cả tám đối thủ cạnh tranh tiếp theo cộng lại, bao gồm Meta, OpenAI và Mistral.

Chiến lược của Qwen là phát hành hơn 100 mô hình trọng số mở theo giấy phép Apache 2.0 đã biến nó trở thành điểm khởi đầu mặc định cho làn sóng phát triển AI toàn cầu. Chính phủ Singapore và Malaysia đang xây dựng hệ sinh thái AI có chủ quyền của họ trên các mô hình trọng số mở của Trung Quốc, trong đó Qwen là lựa chọn hàng đầu. Sự thống trị thầm lặng này, chứ không phải các đợt cắt giảm giá của DeepSeek, mới là sự thay đổi cấu trúc quan trọng hơn trong bối cảnh AI.

Tại sao giá giảm lại là tín hiệu lạc quan cho tính toán

Chi phí token AI giảm mạnh không phải là một tín hiệu tiêu cực cho ngành, mà là một ví dụ điển hình về Nghịch lý Jevons. Được quan sát lần đầu tiên vào năm 1865, nghịch lý này khẳng định rằng khi công nghệ làm cho việc sử dụng một nguồn lực hiệu quả hơn, tổng tiêu thụ nguồn lực đó sẽ tăng lên. Token AI rẻ hơn sẽ không dẫn đến việc sử dụng ít tính toán hơn; chúng sẽ dẫn đến việc tính toán được sử dụng trong nhiều ứng dụng hơn.

CEO Satya Nadella của Microsoft và cựu CEO Pat Gelsinger của Intel đều đã viện dẫn nguyên lý này, cho rằng AI rẻ hơn sẽ mở rộng thị trường cho nó, nhúng trí thông minh vào mọi thứ từ ô tô đến bóng đèn. Điều này gợi ý rằng mô hình tư duy đúng đắn cho token AI không phải là iPhone, với mức giá ổn định, mà là bóng bán dẫn, thứ có chi phí sụp đổ trong suốt 60 năm đã cho phép nó phổ biến vào mọi ngóc ngách của nền kinh tế. Sự sụp đổ về giá là điều kiện tiên quyết cho sự phổ biến của AI.

Hạ tầng là hào nước

Sự bùng nổ AI hiện tại lặp lại thị trường tìm kiếm những năm đầu thập niên 2000. Khi đó, hàng trăm startup đã xây dựng doanh nghiệp có lãi bằng cách đóng gói kết quả tìm kiếm của Google vào các ứng dụng ngách, chỉ để rồi trở nên lỗi thời khi Google tích hợp trực tiếp các tính năng đó. Ngày nay, hàng nghìn ứng dụng được xây dựng theo kiểu "vibe-coded" chỉ là những lớp vỏ mỏng bao quanh các mô hình từ OpenAI hoặc Anthropic, đưa họ vào cùng một vị trí "người thuê nhà" dễ bị tổn thương.

Sự tương đồng lịch sử này gợi ý rằng hào nước thực sự, có thể phòng thủ được trong kỷ nguyên AI không phải là lớp ứng dụng mà là hạ tầng: các mô hình nền tảng, cơ sở hạ tầng vận hành chúng và các con chip đào tạo chúng. Cổ phiếu của Nvidia, đã tăng từ mức $0,66 sau khi điều chỉnh chia tách vào năm 2015 lên hơn $208 hiện nay, là minh chứng cho nơi giá trị được thu giữ. Câu hỏi then chốt cho các nhà đầu tư không phải là liệu một mô hình Trung Quốc có rẻ hơn Claude hay không, mà là liệu nhu cầu về tính toán AI có tiếp tục vượt xa nguồn cung hay không. Mọi tín hiệu hiện có đều cho thấy câu trả lời là có.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.