Việc ngành AI chuyển từ trợ giá cố định sang thanh toán theo token đã kết thúc với việc OpenAI chuẩn bị giảm giá mạnh, thiết lập lại nền kinh tế của thị trường AI tạo sinh trị giá 200 tỷ USD.
Việc ngành AI chuyển từ trợ giá cố định sang thanh toán theo token đã kết thúc với việc OpenAI chuẩn bị giảm giá mạnh, thiết lập lại nền kinh tế của thị trường AI tạo sinh trị giá 200 tỷ USD.

Việc ngành AI chuyển từ trợ giá cố định sang thanh toán theo token đã kết thúc với việc OpenAI chuẩn bị giảm giá mạnh, thiết lập lại nền kinh tế của thị trường AI tạo sinh trị giá 200 tỷ USD.
OpenAI đang xem xét cắt giảm mạnh giá token khi tìm cách giành khách hàng doanh nghiệp từ Anthropic, một động thái sẽ làm thu hẹp biên lợi nhuận tại cả hai phòng thí nghiệm AI vốn đã lỗ hàng tỷ USD mỗi năm.
"Chi phí sử dụng AI đã trở thành một vấn đề lớn," Giám đốc điều hành OpenAI Sam Altman phát biểu tại một sự kiện gần đây, đồng thời nói thêm rằng công ty sẽ "giúp mọi người nhận được nhiều giá trị hơn với chi phí thấp hơn."
Cuộc chiến giá diễn ra sau sáu tháng khắc nghiệt đối với ngân sách AI doanh nghiệp. Từ tháng 2 đến tháng 6, OpenAI, Anthropic và GitHub đều chuyển từ đăng ký giá cố định sang thanh toán token theo mức sử dụng, làm lộ ra những chi phí trước đây bị che giấu. Coinbase đã áp đặt giới hạn chi tiêu hàng tuần từ 500 đến 5.000 USD cho mỗi nhân viên. Uber đã đốt hết toàn bộ ngân sách AI năm 2026 vào tháng 4. Salesforce dự kiến sẽ trả cho Anthropic khoảng 300 triệu USD trong năm nay.
Việc cắt giảm giá có thể làm xói mòn biên lợi nhuận tại cả OpenAI và Anthropic, những công ty vốn đã lỗ hàng tỷ USD cho chi phí điện toán. Nhưng rủi ro sâu xa hơn là giá thấp hơn sẽ xác nhận quan điểm rằng các mô hình AI đã bị hàng hóa hóa — những sản phẩm có thể thay thế lẫn nhau, nơi khách hàng chuyển sang lựa chọn rẻ nhất. Động lực này đe dọa định giá IPO của cả hai công ty và có thể lan sang các nhà cung cấp hạ tầng bao gồm Nvidia, Oracle và CoreWeave.
Từ Trợ giá đến Sốc hóa đơn
Sự chuyển đổi trong cách thanh toán đã được ấp ủ trong ba năm. Đầu năm 2023, OpenAI ra mắt ChatGPT Plus với giá 19,99 USD mỗi tháng, thiết lập tiêu chuẩn giá cố định mà GitHub Copilot của Microsoft và Gemini Advanced của Google nhanh chóng làm theo. Để thúc đẩy áp dụng, các công ty đã trợ giá cho người dùng nặng: Microsoft lỗ trung bình 20 USD cho mỗi người đăng ký GitHub Copilot mỗi tháng, với một số người dùng cao cấp tiêu tốn tới 80 USD.
Đến tháng 6 năm 2026, mô hình đó đã sụp đổ. GitHub chuyển tất cả các gói sang thanh toán dựa trên token, biến khoản đăng ký 19 USD hàng tháng thành một hạn mức token mà một phiên lập trình tự động duy nhất có thể tiêu hao hết. Một kỹ sư phần mềm cao cấp của Deloitte ước tính rằng một prompt cực kỳ chi tiết hiện có thể tiêu tốn hơn 100 USD theo hệ thống mới. Tài liệu dành cho nhà phát triển của Anthropic cho thấy một nhóm 10 người sử dụng Claude Code có thể tiêu hơn 75.600 USD mỗi năm chỉ riêng cho token.
Lợi tức từ khoản chi tiêu đó vẫn rất thấp. Nền tảng dữ liệu doanh nghiệp Entelligence.AI đã phân tích 2.444 công ty và phát hiện ra rằng cứ mỗi 1 USD chi cho token AI, chỉ có 18 xu tạo ra giá trị cho người dùng. Phần còn lại dùng để sửa lỗi do AI gây ra, làm lại và chi phí kiểm tra.
Bài toán Chiến tranh Giá
Động thái cắt giảm giá của OpenAI một phần mang tính phủ đầu. Công ty dự đoán Anthropic sẽ hạ giá riêng của mình, theo những người quen thuộc với vấn đề này, và muốn tấn công trước. Doanh thu của Anthropic đã tăng vọt sau khi Claude Code trở nên phổ biến trong giới kỹ sư phần mềm, và startup 5 năm tuổi này lần đầu tiên vượt qua định giá của OpenAI.
Vấn đề là sản phẩm của cả hai công ty có thể thay thế lẫn nhau ở mức độ cao. Khách hàng có thể chuyển đổi giữa các mô hình của OpenAI và Anthropic với chi phí tối thiểu, nghĩa là giảm giá có thể giữ chân khách hàng tạm thời nhưng không thể xây dựng lợi thế cạnh tranh lâu dài. Vòng luẩn quẩn tài chính cũng mở rộng qua các nhà cung cấp đám mây: OpenAI và Anthropic cùng nhau chiếm hơn một nửa trong số khoảng 2 nghìn tỷ USD cam kết dịch vụ đám mây trong tương lai tại Microsoft, Oracle, Google và Amazon, theo The Information. Kỳ vọng doanh thu thấp hơn tại các phòng thí nghiệm AI có thể lan tỏa qua các hợp đồng đó.
Nhà nghiên cứu AI và khoa học thần kinh Gary Marcus cảnh báo rằng một cuộc suy thoái của OpenAI "có thể sẽ kéo theo Nvidia, Oracle, CoreWeave và những công ty khác đi xuống."
Những Người Thắng cuộc Có thể là Các Giải pháp Thay thế Rẻ hơn
Những người hưởng lợi lớn nhất từ cuộc chiến giá có thể không phải là OpenAI hay Anthropic. Các mô hình AI Trung Quốc đang thu hút sự chú ý của các doanh nghiệp Mỹ nhạy cảm về chi phí. API của DeepSeek được định giá khoảng một phần mười so với GPT-5.5 và một phần mười một so với Claude Opus 4.7, theo ước tính của bên thứ ba. Nền tảng chi tiêu doanh nghiệp Ramp báo cáo vào tháng 6 rằng DeepSeek đã trở thành gói đăng ký phần mềm doanh nghiệp phát triển nhanh nhất trong số các công ty Mỹ.
"Các công ty hiện đang tự hỏi liệu mọi tác vụ có cần một mô hình tiên tiến nhất hay không," Niranjan Krishnan, Giám đốc giải pháp AI tại công ty tư vấn CNTT FPT Americas, cho biết. "Sự mới lạ đã phai nhạt, và tiện ích thực dụng đã thế chỗ."
Coinbase đã bắt đầu chuyển các tác vụ cơ bản sang các mô hình rẻ hơn từ DeepSeek và MiniMax. Harness, một startup phần mềm, đã đào tạo các kỹ sư sử dụng Claude Code hiệu quả hơn, kiểm soát chi phí vốn đã tăng theo cấp số nhân từ tháng 10 đến tháng 3.
Đối với các nhà đầu tư, những tác động rất rõ ràng. Nvidia đang giao dịch ở mức khoảng 35 lần thu nhập dự phóng, với phần lớn mức định giá cao đó gắn liền với nhu cầu đào tạo mô hình AI. Nếu khách hàng doanh nghiệp chuyển sang các mô hình suy luận rẻ hơn và các phòng thí nghiệm nhỏ hơn, chu kỳ mua GPU có thể chậm lại. CoreWeave, công ty đã báo cáo doanh thu quý 1 đạt 2,08 tỷ USD nhưng lỗ ròng 740 triệu USD, đặc biệt dễ bị tổn thương trước động lực định giá của các phòng thí nghiệm AI mà nó phục vụ.
Citadel Securities đã đề xuất một khuôn khổ định giá phân tầng và thanh toán dựa trên sự khan hiếm, trong đó các mô hình tiên tiến nhất vẫn đắt đỏ cho các tác vụ phức tạp trong khi các mô hình đơn giản hơn xử lý công việc thông thường. Cấu trúc đó sẽ bảo toàn doanh thu cho các phòng thí nghiệm AI nhưng giới hạn tổng thị trường có thể tiếp cận cho suy luận cao cấp.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.