Cloudflare đang buộc các công ty AI phải lựa chọn giữa lập chỉ mục tìm kiếm và huấn luyện mô hình trên các trang web có quảng cáo, một sự thay đổi có thể định hình lại cách thức truy cập và kiếm tiền từ khối nội dung số trị giá 200 tỷ USD.
Cloudflare sẽ chặn các crawler web sử dụng hỗn hợp khỏi các trang có quảng cáo theo mặc định từ ngày 15 tháng 9 năm 2026, buộc các công ty AI phải tách biệt lập chỉ mục tìm kiếm khỏi huấn luyện mô hình hoặc trả tiền cho nhà xuất bản để được truy cập. Chính sách này nhắm vào các crawler kết hợp tìm kiếm truyền thống, sử dụng tác nhân AI và huấn luyện mô hình thành một bot duy nhất.
"Phần lớn khách hàng của chúng tôi muốn AI tương tác với nội dung của họ," Stephanie Cohen, giám đốc chiến lược tại Cloudflare, cho biết. "Tuy nhiên, đối với những người phụ thuộc vào quảng cáo và đăng ký, thách thức là khác biệt: họ muốn duy trì khả năng被发现 mà không bị buộc phải cho đi công sức của mình miễn phí."
Chính sách mặc định áp dụng cho khách hàng mới của Cloudflare, các trang web mới do khách hàng hiện tại thiết lập và tất cả người dùng miễn phí hiện tại, với tùy chọn điều chỉnh cài đặt thông qua bảng điều khiển của họ. Cloudflare cũng đang phát triển thí nghiệm Pay Per Crawl thành mô hình Pay Per Use rộng hơn, nơi nhà xuất bản nhận được bồi thường khi nội dung của họ xuất hiện trong kết quả tìm kiếm AI hoặc khi một tác nhân mua thông tin cao cấp. Ceramic.ai và You.com là những đối tác đầu tiên trong chương trình này. Dữ liệu của Cloudflare cho thấy hơn 50% lưu lượng crawler AI liên quan đến việc tìm nạp lại các trang không thay đổi, gây lãng phí băng thông cho cả nhà xuất bản và các công ty AI.
Động thái này giải quyết sự đổ vỡ cấu trúc trong mô hình kinh tế của web. Các công cụ trả lời bằng AI trích xuất thông tin và cung cấp bản tóm tắt mà không gửi người dùng đến nguồn gốc. Anthropic thu thập 11.122 trang cho mỗi lượt giới thiệu mà nó gửi lại, theo dữ liệu từ Adexchanger, trong khi các giới thiệu từ chatbot AI tạo ra lượng truy cập thấp hơn khoảng 96% so với tìm kiếm truyền thống và người dùng nhấp vào các nguồn được trích dẫn chỉ khoảng 1% thời gian. Các nhà xuất bản đã mất từ 20% đến 90% lưu lượng truy cập và doanh thu trong năm qua, tạo ra nhu cầu cấp thiết về một khuôn khổ bồi thường mới.
Cloudflare đặc biệt chỉ trích Google vì có quyền truy cập vào lượng thông tin gần gấp đôi so với các công ty AI khác do gã khổng lồ tìm kiếm này khiến khách hàng khó duy trì khả năng被发现 mà không bị sử dụng cho huấn luyện AI. Google cung cấp một bot có tên Google Extended cho phép chủ sở hữu trang web từ chối sử dụng AI, nhưng Googlebot chủ lực của hãng thu thập dữ liệu cho Tìm kiếm bao gồm các tính năng AI như AI Overviews và AI Mode. "Giờ đây khi phần lớn lưu lượng truy cập trên Internet không phải từ con người, chúng tôi phải tiến xa hơn và hành động nhanh hơn để một hệ sinh thái bền vững có thể hình thành," Matthew Prince, đồng sáng lập kiêm CEO của Cloudflare, cho biết khi công bố chính sách.
Nhà cung cấp hạ tầng này không đơn độc trong việc nhắm đến cơ hội cấp phép nội dung. TollBit, ProRata và Microsoft đều đã tham gia lĩnh vực này, mỗi bên có cách tiếp cận khác nhau về ai kiểm soát các điều khoản. Really Simple Licensing đang thúc đẩy một tiêu chuẩn mở trước khi bất kỳ công ty đơn lẻ nào khóa chặt các quy tắc. Gần 70% nhà xuất bản kỳ vọng các thỏa thuận cấp phép AI sẽ tạo ra ít nhất một phần doanh thu trong ba năm tới, theo Press Gazette, mặc dù hầu hết coi đó là nguồn thu nhỏ hiện tại.
Cloudflare có kế hoạch ra mắt bảng điều khiển Attribution Business Insights, hiển thị cách các bot AI truy cập nội dung, nội dung đó được trích dẫn ở đâu và lượng truy cập con người mà các nền tảng AI khác nhau mang lại. Công cụ này sẽ giúp cho việc tối ưu hóa công cụ trả lời (answer engine optimization) — thực hành làm cho nội dung có thể被发现 bởi AI thay vì chỉ bởi các công cụ tìm kiếm — có thể đo lường được lần đầu tiên.
Rủi ro từ cách tiếp cận của Cloudflare là đáng kể. Công ty có thể kiểm soát việc nhận dạng tác nhân, lớp cấp quyền, đo lường sử dụng và cơ sở hạ tầng thanh toán, tập trung quyền lực vào một trung gian duy nhất. Việc ghi nhận nguồn cũng vẫn chưa được giải quyết: một câu trả lời do AI tạo ra có thể kết hợp hàng chục nguồn hoặc diễn giải lại một ý tưởng gốc mà không hiển thị trích dẫn. Truy cập trả phí cũng có thể củng cố lợi thế hiện có cho các nền tảng AI được tài trợ tốt, đồng thời khiến web trở nên đắt đỏ hơn đối với các công ty khởi nghiệp, nhà nghiên cứu và nhà phát triển mã nguồn mở.
Cloudflare đang giao dịch ở mức khoảng 45 lần thu nhập dự phóng, phản ánh kỳ vọng của thị trường rằng vị thế cơ sở hạ tầng của công ty sẽ chuyển thành các nguồn doanh thu mới. Mô hình Pay Per Use của Cloudflare, nếu được áp dụng rộng rãi, có thể tạo ra một dòng doanh thu định kỳ gắn với tiêu thụ nội dung AI — một mô hình kinh doanh mà chưa nhà cung cấp cơ sở hạ tầng đám mây nào chứng minh được ở quy mô lớn.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.