Anthropic kêu gọi tạm dừng AI toàn cầu khi các mô hình tiến gần đến cột mốc tự cải thiện

Anthropic, công ty khởi nghiệp AI trị giá 965 tỷ USD đứng sau chatbot Claude, đã đăng một bài viết trên blog hôm thứ Năm kêu gọi các phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới xem xét tạm dừng phát triển mô hình tiên tiến trên toàn cầu có phối hợp. Công ty cảnh báo rằng các hệ thống AI đang tiến gần đến "khả năng tự cải thiện đệ quy" — khả năng thiết kế và xây dựng phiên bản kế nhiệm của chính mình mà không cần sự can thiệp của con người — và cho biết ngưỡng đó có thể đạt đến trong vòng hai năm, hoặc sớm hơn.

"Nếu có thể làm chậm sự phát triển của công nghệ này một cách hiệu quả để cho chúng ta thêm thời gian đối phó với những tác động to lớn của nó, chúng tôi nghĩ đó có thể sẽ là một điều tốt," Marina Favaro, người đứng đầu bộ phận nghiên cứu nội bộ của Anthropic, và Jack Clark, người đứng đầu bộ phận chính sách của công ty, đã viết trong bài đăng có tiêu đề "Khi AI Tự Xây Dựng Chính Mình."

Cảnh báo đi kèm với dữ liệu nội bộ mà Anthropic chưa từng công bố công khai trước đây. Tính đến tháng 5 năm 2026, hơn 80% mã được hợp nhất vào cơ sở mã sản xuất của Anthropic được viết bởi Claude, mô hình AI của công ty. Kỹ sư trung bình hiện hợp nhất lượng mã nhiều gấp tám lần mỗi ngày so với năm 2024. Trong một cuộc khảo sát tháng 3 đối với 130 nhân viên nghiên cứu, nhân viên trung vị ước tính rằng việc sử dụng mô hình mới nhất của công ty, Mythos Preview, giúp họ làm việc hiệu quả gấp khoảng bốn lần so với khi làm việc mà không có bất kỳ công cụ AI nào.

Lời kêu gọi chậm lại này đến vào một thời điểm khó xử đối với Anthropic. Công ty gần đây đã hoàn tất vòng gọi vốn Series H trị giá 65 tỷ USD, đưa định giá của công ty lên khoảng 965 tỷ USD, biến nó thành công ty khởi nghiệp AI có giá trị nhất thế giới — vượt qua OpenAI. Công ty cũng đã bí mật nộp hồ sơ cho đợt phát hành cổ phiếu lần đầu ra công chúng (IPO). Doanh thu hàng năm đã tăng vọt từ 90 tỷ USD vào cuối năm 2025 lên ước tính 500 tỷ USD vào tháng 6 năm 2026, theo công ty.

Ngưỡng tự cải thiện đệ quy

Mối quan tâm trọng tâm của Anthropic là một khái niệm được gọi là tự cải thiện đệ quy — thời điểm mà một hệ thống AI có thể tự động thiết kế, viết mã và đào tạo các mô hình kế nhiệm mà không cần sự chỉ đạo của con người. Công ty đã vạch ra một lộ trình tiến triển: các mô hình Claude ban đầu (2021-2023) yêu cầu con người viết tất cả mã; đến năm 2023-2025, chatbot hỗ trợ viết các đoạn mã; đến năm 2025-2026, các tác nhân mã hóa độc lập viết và sửa đổi toàn bộ tệp tin; và hiện tại, các tác nhân tự động có thể chạy mã và phân công nhiệm vụ cho các tác nhân khác. Giai đoạn cuối cùng — một "vòng khép kín" nơi Claude xây dựng và cải thiện các phiên bản tương lai của chính nó — vẫn chưa đến, nhưng Clark viết rằng ông tin rằng điều đó "có thể xảy ra trong vòng hai năm, hoặc sớm hơn."

Dữ liệu ủng hộ khả năng đang tăng tốc. Thời lượng của các tác vụ mà Claude có thể hoàn thành độc lập đã tăng gấp đôi sau mỗi bốn tháng, giảm so với mỗi bảy tháng trước đây. Claude Opus 3 vào tháng 3 năm 2024 có thể xử lý các tác vụ yêu cầu khoảng bốn phút làm việc của con người; Claude Opus 4.6 một năm sau đó có thể xử lý các tác vụ kéo dài 12 giờ. Mythos Preview, mô hình mới nhất của Anthropic, có thể làm việc liên tục trong ít nhất 16 giờ, theo tổ chức nghiên cứu METR, tổ chức cho biết mô hình này nằm "ở giới hạn trên của những gì METR có thể đo lường mà không cần đưa ra các tác vụ mới."

Trên SWE-bench, một chuẩn mực kỹ thuật phần mềm thực tế tiêu chuẩn, điểm số của mô hình đã tăng từ một chữ số lên gần bão hòa trong hai năm. Trên CORE-Bench, nơi kiểm tra xem các mô hình có thể tái tạo kết quả nghiên cứu đã công bố hay không, tỷ lệ thành công đã tăng từ khoảng 20% vào năm 2024 lên bão hòa chuẩn mực trong vòng 15 tháng.

Nhà phê bình cho rằng đây là chiêu trò thâu tóm quyền quản lý

Lập trường ưu tiên an toàn của Anthropic đã vấp phải sự hoài nghi từ các đối thủ và nhà quan sát ngành. Giám đốc điều hành OpenAI Sam Altman đã cáo buộc công ty này "tiếp thị dựa trên nỗi sợ hãi," nói vào tháng trước: "Rõ ràng đây là một chiến lược tiếp thị tuyệt vời khi nói rằng, 'Chúng tôi đã chế tạo một quả bom, chúng tôi sắp thả nó xuống đầu bạn. Chúng tôi sẽ bán cho bạn một hầm trú bom với giá 100 triệu USD.'"

David Sacks, một nhà đầu tư mạo hiểm và cố vấn không chính thức cho Tổng thống Hoa Kỳ Donald Trump, đã cáo buộc Anthropic theo đuổi "chương trình nghị sự thâu tóm quyền quản lý" — sử dụng những cảnh báo về rủi ro hiện sinh để thúc đẩy các quy định nặng tay nhằm hạn chế các mô hình nguồn mở chi phí thấp và thúc đẩy nhu cầu đối với công nghệ độc quyền của Anthropic.

Ethan Mollick, giáo sư tại Trường Kinh doanh Wharton của Đại học Pennsylvania, đã đăng trên X rằng bài đăng trên blog chứa "một chút tự mãn, một chút tiếp thị, và rất nhiều niềm tin chân thành về những gì Anthropic nghĩ là có khả năng xảy ra trong tương lai gần của AI."

Anthropic thừa nhận thách thức xác minh vốn có trong bất kỳ lệnh tạm dừng toàn cầu nào. "Các đợt chạy huấn luyện dễ che giấu hơn nhiều so với hầm chứa tên lửa," các tác giả viết, so sánh nỗ lực này với các hiệp ước kiểm soát vũ khí thời Chiến tranh Lạnh. "Một sự chậm lại hoặc tạm dừng có ý nghĩa sẽ đòi hỏi nhiều phòng thí nghiệm có nguồn lực tốt ở hoặc gần biên giới công nghệ, tại nhiều quốc gia, đồng ý dừng lại trong cùng các điều kiện."

Công ty cho biết Viện Anthropic của họ sẽ hợp tác với các đối tác để nghiên cứu một hệ thống xác minh đáng tin cậy sẽ như thế nào, và rằng họ có kế hoạch tổ chức các cuộc tranh luận rộng rãi hơn với các nhà hoạch định chính sách và nhà nghiên cứu. Nếu một hệ thống như vậy có thể được xây dựng, Anthropic cho biết họ sẵn sàng làm chậm hoặc tạm dừng việc phát triển của chính mình — với điều kiện các phòng thí nghiệm tiên tiến khác có thể kiểm chứng cũng làm như vậy.

Ý nghĩa đối với nhà đầu tư

Lời kêu gọi tạm dừng có phối hợp của Anthropic đưa ra sự không chắc chắn về quy định cho toàn bộ lĩnh vực AI tại thời điểm dòng vốn đang đổ vào ồ ạt. Dữ liệu của chính công ty — cho thấy năng suất kỹ sư tăng 8 lần và năng suất lao động tăng 4 lần — đồng thời củng cố luận điểm đầu tư rằng AI mang lại lợi nhuận kinh tế có thể đo lường được. Nghịch lý là Anthropic vừa là người hưởng lợi từ sự tăng tốc của AI, vừa là tiếng nói lớn nhất kêu gọi nó dừng lại.

OpenAI cũng dự kiến sẽ tiến hành IPO trong thời gian tới, và hai công ty cùng nhau đại diện cho khoảng 2 nghìn tỷ USD giá trị thị trường kết hợp. Bất kỳ khuôn khổ quy định nào xuất hiện từ cuộc tranh luận này có thể quyết định mô hình kinh doanh nào — độc quyền so với nguồn mở, an toàn trước so với tốc độ trước — cuối cùng sẽ chiến thắng. Hiện tại, thị trường vẫn chưa định giá rủi ro của một lệnh tạm dừng toàn cầu có phối hợp, một phần vì cơ chế thực thi vẫn chưa được xác định và động cơ gian lận là rất lớn.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.