Mô hình tạo video mới nhất của Alibaba xuất hiện trong bối cảnh các gã khổng lồ công nghệ Trung Quốc đổ hàng tỷ USD để thu hẹp khoảng cách với đối thủ Mỹ trên thị trường video AI đang phát triển nhanh chóng.
Mô hình tạo video mới nhất của Alibaba xuất hiện trong bối cảnh các gã khổng lồ công nghệ Trung Quốc đổ hàng tỷ USD để thu hẹp khoảng cách với đối thủ Mỹ trên thị trường video AI đang phát triển nhanh chóng.

Mô hình tạo video mới nhất của Alibaba xuất hiện trong bối cảnh các gã khổng lồ công nghệ Trung Quốc đổ hàng tỷ USD để thu hẹp khoảng cách với đối thủ Mỹ trên thị trường video AI đang phát triển nhanh chóng.
Tập đoàn Alibaba Group Holding đã phát hành HappyHorse 1.1 vào ngày 22 tháng 6, một bản cập nhật lớn cho mô hình tạo video của hãng, mang đến những cải tiến trên năm khía cạnh — biểu cảm động, độ nhất quán của chủ thể, khả năng làm theo hướng dẫn, chất lượng hình ảnh và khả năng âm thanh — khi gã khổng lồ thương mại điện tử và điện toán đám mây đẩy mạnh cuộc chơi vào AI tạo sinh.
"HappyHorse 1.1 đại diện cho một bản nâng cấp có hệ thống trong cách mô hình của chúng tôi hiểu và tạo ra chuyển động, duy trì nhận dạng nhân vật xuyên suốt các khung hình, và căn chỉnh theo hướng dẫn của người dùng," Alibaba cho biết trong một bài giới thiệu sản phẩm, mà không tiết lộ các điểm chuẩn cụ thể hay thông số huấn luyện.
Bản cập nhật diễn ra khi Alibaba đầu tư mạnh vào hạ tầng AI. Công ty đã cam kết 380 tỷ NDT (52,4 tỷ USD) trong nhiều năm cho AI và điện toán đám mây, theo các hồ sơ nộp gần đây nhất, định vị mình trước các đối thủ bao gồm Ernie Bot của Baidu và Doubao của ByteDance trong cuộc đua AI ngày càng chật chội tại Trung Quốc. Trên toàn cầu, thị trường tạo video AI đã thu hút những tên tuổi lớn như Sora của OpenAI, ra mắt đầu năm 2024, và Make-A-Video của Meta, mặc dù cả hai đều chưa công bố số liệu áp dụng chi tiết.
Việc tích hợp âm thanh của HappyHorse 1.1 đánh dấu một bổ sung đáng chú ý, cho phép mô hình tạo ra âm thanh đồng bộ cùng với video — một tính năng mà các mô hình cạnh tranh từ Runway và Pika Labs cũng đang phát triển. Alibaba không cho biết liệu mô hình này có sẵn trên nền tảng đám mây của hãng hay dưới dạng API độc lập, cũng như không tiết lộ giá hoặc chi phí suy luận cho mỗi video.
Mô hình này được xây dựng dựa trên chiến lược AI rộng lớn hơn của Alibaba, bao gồm dòng mô hình ngôn ngữ lớn Qwen và các khoản đầu tư vào chip AI thông qua nhánh bán dẫn T-Head. Mảng điện toán đám mây của công ty, đã báo cáo doanh thu 106,6 tỷ NDT trong năm tài chính gần nhất, đang tiếp thị các khả năng AI như một động lực tăng trưởng giữa bối cảnh thương mại điện tử tại Trung Quốc tăng trưởng chậm lại.
Cổ phiếu Alibaba đóng cửa ở mức 107,06 USD trên Sàn giao dịch chứng khoán New York vào ngày 18 tháng 6, mang lại cho công ty vốn hóa thị trường khoảng 248,7 tỷ USD. Cổ phiếu này đã đối mặt với những cản trở trong năm nay từ căng thẳng địa chính trị gia tăng — bao gồm việc bị đưa vào danh sách đen của Lầu Năm Góc trong những ngày gần đây — và những lo ngại về khả năng sinh lời từ chi tiêu AI của hãng. Các nhà phân tích được Bloomberg khảo sát dự kiến doanh thu đám mây của Alibaba sẽ tăng 12% trong năm tài chính hiện tại, với các khối lượng công việc liên quan đến AI chiếm tỷ trọng ngày càng tăng.
Các cược cạnh tranh rất cao. Thị trường video AI của Trung Quốc có thể đạt 3,2 tỷ USD vào năm 2028, theo ước tính của IDC, khi nhu cầu tăng lên từ quảng cáo, giải trí và các nền tảng video ngắn. Doubao của ByteDance và Kling của Kuaishou cũng đã phát hành các công cụ tạo video, tạo ra một mặt bằng cạnh tranh đông đúc, nơi sự khác biệt về chất lượng và chi phí sẽ quyết định người chiến thắng.
Đối với các nhà đầu tư, câu hỏi đặt ra là liệu các khoản đầu tư AI của Alibaba có thể chuyển thành tăng trưởng doanh thu đám mây có thể đo lường được trước khi chương trình chi tiêu vốn 380 tỷ NDT gây áp lực lên biên lợi nhuận hay không. Công ty đang giao dịch ở mức gấp khoảng 10 lần thu nhập dự phóng, thấp hơn so với các đối thủ đám mây Mỹ, phản ánh sự hoài nghi của thị trường về tốc độ kiếm tiền từ AI tại Trung Quốc.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.