Google tăng tốc cuộc đua AI với mô hình âm thanh Gemini

Google triển khai Gemini 3.1 Flash Live để tăng cường trò chuyện AI thời gian thực

Google đã công bố vào ngày 26 tháng 3 năm 2026, rằng họ đang tăng cường AI Gemini của mình với một mô hình âm thanh và giọng nói mới có tên Gemini 3.1 Flash Live. Bản cập nhật này trực tiếp nhắm vào khả năng đàm thoại thời gian thực của AI, nhằm mục đích cung cấp các tương tác nhanh hơn và tự nhiên hơn. Sự phát triển này định vị Google để cạnh tranh tốt hơn với các sản phẩm của OpenAI và Apple, nơi giao tiếp bằng giọng nói lưu loát, độ trễ thấp là một tính năng quan trọng để người dùng chấp nhận. Bằng cách tích hợp một mô hình âm thanh chuyên biệt, Google tìm cách thu hẹp mọi khoảng cách hiệu suất được cảm nhận và thiết lập Gemini trở thành một đối thủ hàng đầu trong thị trường trợ lý AI.

Đại tu nền tảng nhằm giành nhà phát triển từ OpenAI

Mô hình mới này là một phần của chiến lược triển khai lớn hơn nhiều trong hệ sinh thái nhà phát triển của Google. Công ty đồng thời đã cung cấp rộng rãi các mô hình Gemini 3.1 Pro và Gemini 3.1 Flash cốt lõi của mình thông qua một Google AI Studio được cập nhật đáng kể. Cuộc đại tu nền tảng này cung cấp cho các nhà phát triển một giao diện thống nhất để xây dựng với các mô hình văn bản, hình ảnh và âm thanh, hợp lý hóa việc tạo ra các ứng dụng phức tạp. Để làm phong phú thêm bộ công cụ, Google cũng đã tung ra Gemini 3.1 Flash Image để chỉnh sửa hình ảnh nâng cao và làm cho mô hình Imagen 4 của mình, có khả năng tạo hình ảnh độ phân giải lên đến 2K, được truy cập rộng rãi. Động thái phối hợp này được thiết kế để làm cho nền tảng của Google hấp dẫn và chức năng hơn đối với các nhà phát triển, trực tiếp thách thức sự thống trị của hệ sinh thái OpenAI.

MAI-Image-2 của Microsoft làm nổi bật cuộc đua AI ba chiều khốc liệt

Áp lực cạnh tranh thúc đẩy sự đổi mới nhanh chóng của Google là rõ ràng trên toàn cảnh AI. Microsoft gần đây đã ra mắt mô hình hình ảnh thế hệ thứ hai của mình, MAI-Image-2, mô hình này đã nhanh chóng giành được vị trí thứ ba trên điểm chuẩn Arena.ai được tham chiếu rộng rãi. Nó chỉ xếp sau các mô hình Gemini của Google và OpenAI, minh họa cách một cuộc đua ba chiều để giành quyền tối cao về AI đang định hình thị trường. Trong khi các bản cập nhật mới nhất của Google tập trung vào âm thanh đàm thoại và các công cụ dành cho nhà phát triển, thì tiến bộ của Microsoft trong việc tạo ảnh nhấn mạnh bản chất đa phương thức, rộng lớn của cuộc cạnh tranh này. Mỗi gã khổng lồ công nghệ đang chiến đấu để đạt được hiệu suất tiên tiến nhất trên các lĩnh vực văn bản, âm thanh và hình ảnh để chiếm lĩnh thị trường và tâm trí nhà phát triển.