Deutsche Bank cảnh báo khoảng cách chi phí AI gấp 65 lần giữa mô hình tiên phong và mô hình mở

Deutsche Bank ước tính Claude Fable 5 của Anthropic có chi phí khoảng 3,25 USD cho mỗi tác vụ, trong khi DeepSeek V4-Pro chạy ở mức khoảng 5 xu — một khoảng cách gấp 65 lần mà ngân hàng này cho rằng giống với định giá "hàng hiệu địa vị" hơn là phản ánh sự vượt trội về hiệu suất thực sự.

"Các mô hình tiên phong giống như một siêu xe mới toanh rực rỡ; các mô hình trọng lượng mở giống như một chiếc xe gia đình cũ đáng tin cậy," các nhà phân tích viết trong một báo cáo ngày 20/6. Đối với khoảng 90% các tác vụ doanh nghiệp thông thường, mô hình rẻ hơn mang lại kết quả tương đương, họ cho biết.

Claude Fable 5 đạt 60 điểm trên chỉ số thông minh Artificial Analysis so với 44 điểm của DeepSeek V4-Pro. Chi phí vận hành AI ở một mức năng lực cố định đã giảm với hệ số từ 9 lần đến 900 lần mỗi năm, báo cáo lưu ý, trong khi độ trễ giữa các mô hình tiên phong đóng và giải pháp trọng lượng mở tốt nhất đã thu hẹp từ khoảng 12 tháng xuống còn khoảng ba tháng.

Phát hiện này đe dọa sức mạnh định giá của các phòng thí nghiệm tiên phong như Anthropic và OpenAI khi họ chuẩn bị cho các đợt phát hành cổ phiếu lần đầu ra công chúng (IPO). Nếu các doanh nghiệp chuyển 80% khối lượng công việc sang các mô hình rẻ hơn 99% — như Giám đốc điều hành Coinbase Brian Armstrong đã dự đoán vào tuần trước — thì các mô hình doanh thu làm nền tảng cho các định giá AI trị giá hàng tỷ USD sẽ phải đối mặt với áp lực cơ cấu.

Khoảng Cách Chi Phí Ngày Càng Nới Rộng

Khoảng cách này không chỉ đơn thuần là câu chuyện Mỹ đấu với Trung Quốc. Muse Spark của Meta, Nemotron 3 Ultra của Nvidia và gpt-oss-120b của chính OpenAI đều nằm ở nhóm chi phí thấp cùng với DeepSeek, báo cáo cho biết. Ranh giới thực sự nằm giữa các mô hình tiên phong độc quyền và các giải pháp thay thế trọng lượng mở, chứ không phải giữa các khu vực địa lý.

Các quyết định định giá của Anthropic minh họa cho động lực này. Claude Fable 5 ra mắt ngày 9/6 với mức giá 10 USD cho mỗi triệu token đầu vào và 50 USD cho mỗi triệu token đầu ra — gấp đôi giá của Opus 4.8 và là mô hình lớn đắt nhất trên thị trường. Công ty sau đó đã chuyển việc sử dụng Claude theo chương trình sang các tín dụng đo lường được tính theo giá API đầy đủ vào ngày 15/6, mang lại mức tăng giá hiệu quả từ 12 lần đến 175 lần tùy thuộc vào tác vụ, theo các ước tính được trích dẫn trong báo cáo.

Sự chuyển dịch từ gói đăng ký giá cố định sang thanh toán theo token đang bộc lộ độ nhạy cảm về chi phí của doanh nghiệp. Uber đã đốt hết toàn bộ ngân sách năm 2026 cho các công cụ lập trình AI vào tháng 4 và hiện giới hạn mỗi nhân viên ở mức 1.500 USD cho mỗi công cụ mỗi tháng chi tiêu token. ServiceNow đã đốt hết ngân sách Anthropic cả năm trong vài tháng đầu năm 2026. Thậm chí Microsoft đã hủy hầu hết giấy phép Claude Code nội bộ vào tháng 5 và chuyển các kỹ sư sang GitHub Copilot.

Rủi Ro Tái Định Giá

Deutsche Bank đưa ra sự so sánh trực tiếp với "khoảnh khắc DeepSeek" vào đầu năm 2025, khi thị trường nhận ra năng lực AI gần như tiên phong có thể được xây dựng với chi phí thấp hơn nhiều. Cú sốc đó đã gây ra một đợt bán tháo mạnh cổ phiếu AI, mặc dù thị trường sau đó đã phục hồi khi nhu cầu tổng thể tiếp tục tăng.

Sự điều chỉnh hiện tại có thể diễn ra âm thầm hơn nhưng kéo dài hơn, ngân hàng cho biết. Nếu các mô hình AI độc quyền đã được định giá và giao dịch một phần như hàng hóa địa vị — nơi giá cao tự nó là một đặc điểm — thì việc tái định giá toàn bộ hiệu quả chi phí của chúng có thể tạo ra một đợt tái định giá sâu hơn lần thứ hai đối với cổ phiếu AI.

Nghiên cứu của Epoch AI được trích dẫn trong báo cáo cung cấp sự xác nhận độc lập: khoảng cách năng lực AI tiên phong giữa Mỹ và Trung Quốc trung bình khoảng bảy tháng, một khoảng cách khớp chặt chẽ với khoảng cách giữa các mô hình độc quyền và trọng lượng mở. Các khía cạnh địa chính trị và thương mại của sự phân chia AI về cơ bản là cùng một vực thẳm, báo cáo kết luận.

Anthropic đã chốt một vòng gọi vốn 65 tỷ USD với mức định giá 965 tỷ USD vào cuối tháng 5, với doanh thu hàng năm đạt 47 tỷ USD, tăng từ 9 tỷ USD vào cuối năm ngoái. Công ty có mọi động cơ để bảo vệ doanh thu mà định giá của họ phụ thuộc vào, báo cáo lưu ý. Nhưng khi các giải pháp thay thế khả thi ngày càng nhiều — token trọng lượng mở có chi phí thấp hơn từ 8 đến 100 lần so với các mô hình tiên phong — không có doanh nghiệp nào cần phải gắn hoạt động của mình với bất kỳ nhà cung cấp đơn lẻ nào.

Các công ty xây dựng các lớp định tuyến độc lập với mô hình, nơi mỗi tác vụ được ghép với mô hình rẻ nhất thực hiện tốt tác vụ đó, sẽ sử dụng nhiều AI hơn với chi phí thấp hơn và theo cách riêng của họ. Các đội ngũ mua sắm doanh nghiệp đã bắt đầu nắm bắt điều này: các công ty lớn đã chi 37 tỷ USD cho AI tạo sinh trong năm 2025, với hơn một nửa — 19 tỷ USD — đổ vào tầng ứng dụng thay vì trực tiếp cho các nhà cung cấp mô hình.

Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.