Coinbase đã cắt giảm gần một nửa chi tiêu cho AI bằng cách định tuyến hầu hết các tác vụ qua các mô hình mã nguồn mở Trung Quốc, thách thức sức mạnh định giá của các nhà cung cấp AI cao cấp của Mỹ.
Coinbase đã cắt giảm gần một nửa chi tiêu cho AI bằng cách định tuyến hầu hết các tác vụ qua các mô hình mã nguồn mở Trung Quốc, thách thức sức mạnh định giá của các nhà cung cấp AI cao cấp của Mỹ.

Giám đốc điều hành Coinbase, Brian Armstrong, cho biết công ty đã cắt giảm gần 50% chi tiêu cho AI bằng cách thiết lập các mô hình mã nguồn mở Trung Quốc GLM 5.2 và Kimi 2.7 làm lựa chọn mặc định thông qua một cổng LLM nội bộ, trong khi mức sử dụng token tiếp tục tăng theo cấp số nhân.
"91% kỹ sư không bao giờ chạm tới hạn mức sử dụng của họ, vì vậy chúng tôi không thắt chặt hạn ngạch — chúng tôi đã chuyển sang các mô hình mặc định rẻ hơn," Armstrong cho biết trong một bài đăng trên X vào thứ Sáu.
Sàn giao dịch tiền điện tử này đã triển khai ba biện pháp cắt giảm chi phí: một hệ thống định tuyến thông minh tiền xử lý các lời nhắc và phân bổ nhiệm vụ cho mô hình hiệu quả nhất về chi phí dựa trên tỷ lệ trúng cache và giá cả; bộ nhớ đệm tích cực đã nâng tỷ lệ trúng cache của LibreChat từ 5% lên 60%; và tinh gọn ngữ cảnh yêu cầu các kỹ sư bắt đầu phiên mới khi chuyển đổi tác vụ. Đối với các tác vụ lập kế hoạch và suy luận phức tạp, các kỹ sư vẫn có thể gọi các mô hình hàng đầu, trong khi đánh giá mã sử dụng chiến lược đa mô hình song song, nơi các đầu ra kiểm tra chéo lẫn nhau.
Sự thay đổi này xác nhận tính khả thi thương mại của AI mã nguồn mở Trung Quốc trong môi trường sản xuất doanh nghiệp phương Tây, trực tiếp thách thức sức mạnh định giá của các nhà cung cấp Mỹ như OpenAI và Anthropic. Đối với Coinbase, việc cắt giảm chi phí có thể cải thiện tỷ suất lợi nhuận và các chỉ số sinh lời tại thời điểm công ty đang mở rộng sử dụng AI thay vì hạn chế nó.
Định tuyến thông minh thay thế lựa chọn mô hình thủ công
Armstrong cho biết khung lập lịch tùy chỉnh của công ty tiền xử lý mọi lời nhắc, sau đó tự động định tuyến nó đến mô hình phù hợp nhất dựa trên xác suất trúng cache và định giá mỗi token. Mục tiêu, ông nói, là để AI xử lý việc lựa chọn mô hình thay vì để các kỹ sư làm việc đó. Các tác vụ ở cấp độ thực thi, ông lập luận, không yêu cầu các mô hình hàng đầu đắt nhất — chỉ có các tác vụ lập kế hoạch và suy luận mới cần.
Bộ nhớ đệm và kỷ luật ngữ cảnh tạo ra phần lớn khoản tiết kiệm
Coinbase hiện yêu cầu tất cả các yêu cầu AI phải nhận biết cache, nghĩa là hệ thống kiểm tra xem phản hồi trước đó có thể được tái sử dụng trước khi tạo ra phản hồi mới hay không. Việc triển khai LibreChat minh họa tác động: tỷ lệ trúng cache đã tăng vọt từ 5% lên 60% sau khi tối ưu hóa. Armstrong cũng kêu gọi các kỹ sư giữ cho cửa sổ ngữ cảnh gọn nhẹ — bắt đầu phiên mới, thu hẹp phạm vi tệp và ngắt kết nối các công cụ không sử dụng — để giảm lãng phí tiêu thụ token.
Công ty chưa tiết lộ số liệu chi tiêu tuyệt đối. Nhưng việc đạt được mức giảm gần 50% trong khi mức sử dụng token tăng với tốc độ cấp số nhân cho thấy Coinbase đã phần nào tách rời mức tiêu thụ khỏi chi phí.
Điều này có ý nghĩa gì đối với thị trường AI
Việc áp dụng GLM 5.2 — do Zhipu AI có trụ sở tại Bắc Kinh phát triển — và Kimi 2.7 — từ Beijing Moonshot AI — làm mô hình doanh nghiệp mặc định đánh dấu một cột mốc cho AI mã nguồn mở Trung Quốc trong cơ sở hạ tầng doanh nghiệp phương Tây. GPT-4o của OpenAI và Claude 4 của Anthropic, vốn có mức giá cao cấp, giờ đây phải đối mặt với một giải pháp thay thế chi phí thấp đáng tin cậy mà các doanh nghiệp có thể triển khai mà không hy sinh chất lượng cho các tác vụ thông thường.
Đối với các nhà đầu tư, hàm ý rất rõ ràng: nếu các doanh nghiệp lớn khác làm theo kịch bản của Coinbase, thị trường có thể tiếp cận cho các mô hình AI cao cấp của Mỹ có thể bị thu hẹp chỉ còn các tác vụ có độ phức tạp cao, làm giảm kỳ vọng tăng trưởng doanh thu cho các nhà cung cấp phụ thuộc vào việc áp dụng doanh nghiệp toàn diện. Coinbase, giao dịch với mã COIN trên Nasdaq, chưa tiết lộ khoản tiết kiệm chính xác bằng đô la, nhưng sự cải thiện chi phí mang tính cấu trúc hỗ trợ mở rộng tỷ suất lợi nhuận khi quy mô sử dụng AI tăng lên.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.