Google ra Gemini 3 - mô hình AI có khả năng đọc hiểu tình huống

00:00 / 0:00

Chuẩn

Tốc độ đọc

Gemini 3 được giới thiệu có thể đọc hiểu đa phương thức, hiểu nhiều tầng ý nghĩa của câu lệnh, cùng khả năng lập luận sâu, trả lời súc tích.

"Thật kinh ngạc khi chỉ trong hai năm, AI đã đột phá từ việc đọc văn bản và hình ảnh đơn thuần đến khả năng đọc hiểu tình huống", CEO Google Sundar Pichai nói trong buổi ra mắt Gemini 3 rạng sáng 19/11 (giờ Hà Nội).

Đây là mô hình AI mới nhất được hãng tung ra, sau Gemini 1, 2 và 2.5. Theo Pichai, trong khi thế hệ đầu tiên sở hữu các đột phá về khả năng xử lý ngữ cảnh dài, thế hệ hai đặt nền móng cho tác nhân AI và đẩy mạnh khả năng lập luận, tư duy, Gemini 3 "là mô hình thông minh nhất của Google, tổng hợp toàn kết hợp toàn bộ năng lực của Gemini".

"Chúc mừng Google với Gemini 3. Có vẻ một mô hình tuyệt vời", Sam Altman, CEO OpenAI - nhà phát triển ChatGPT, bình luận. Trong khi đó, Elon Musk, nhà sáng lập xAI với mô hình Grok, cũng để lại lời chúc dưới bài đăng của Pichai trên X.

Hình minh họa Gemini 3. Ảnh: Google

Theo đại diện Google, mô hình AI mới xây dựng khả năng lập luận tối tân để nắm bắt những tầng ý nghĩa sâu sắc và tinh tế, bao gồm "nhận ra các gợi ý rất nhỏ trong một ý tưởng sáng tạo", hay bóc tách những lớp chồng chéo của một vấn đề phức tạp, giúp người dùng có thể nhận được câu trả lời vừa ý với ít câu lệnh hơn.

Demis Hassabis, CEO Google DeepMind, cho biết phiên bản trải nghiệm đầu tiên của thế hệ mới là Gemini 3 Pro vượt trội so với bản 2.5 Pro trên mọi công cụ đánh giá. Chẳng hạn trên bảng xếp hạng LMArena, mô hình có điểm số 1501, năng lực lập luận ở trình độ tiến sĩ theo phép đo của Humanity’s Last Exam.

Ngoài việc đưa ra bảng điểm với nhiều yếu tố vượt trội GPT-5.1 của OpenAI, Google cũng khẳng định các phản hồi của mô hình "thông minh, súc tích và trực diện, thay thế những câu nói tâng bốc sáo rỗng bằng góc nhìn giá trị và chân thực". Câu này được cho là nhằm đối đầu với GPT mới, khi mô hình của OpenAI vẫn "quá nịnh hót".

Hassabis cũng nhấn mạnh Gemini 3 được nâng cao khả năng lập luận, năng lực đọc hiểu hình ảnh và không gian, hiệu năng đa ngôn ngữ tốt cùng cửa sổ ngữ cảnh xử lý tối đa một triệu token đầu vào.

Bảng so sánh được Google đưa ra về sức mạnh của Gemini 3 Pro và một số mô hình khác.

Trong minh họa, khi được ra lệnh về học cách nấu ăn theo công thức gia truyền, Gemini 3 giải mã và dịch các công thức viết tay sang nhiều ngôn ngữ khác nhau và tạo nên một sổ tay nấu ăn để các người dùng có thể chia sẻ với nhau.

Google cũng cho biết người dùng có thể cung cấp cho Gemini các bài nghiên cứu học thuật, video bài giảng dài hoặc các khóa hướng dẫn để mô hình chuyển đổi thành thẻ tương tác, giúp người dùng dễ tiếp thu kiến thức, hay AIcó thể phân tích video trận pickleball để xác định những điểm cần cải thiện và lên kế hoạch luyện tập nâng cao kỹ thuật.

Cùng với Gemini 3, Google cũng giới thiệu nền tảng phát triển tác nhân AI là Google Antigravity, trình diễn việc đưa mô hình mới vào các sản phẩm hiện có như Search, AI Mode. Đây cũng là lần đầu mô hình AI của Google được đưa vào sản phẩm ngay sau khi ra mắt. Trước đó, Gemini đầu tiên được giới thiệu tháng 12/2023 và ra thị trường vào đầu năm sau đó.

Theo CEO Sundar Pichai, Gemini là một trong những dự án khoa học và phát triển sản phẩm quy mô nhất trong lịch sử công ty. Một số ứng dụng của AI này như công cụ AI Overviews hiện có hai tỷ người dùng mỗi tháng, ứng dụng Gemini vượt mốc 650 triệu người dùng hàng tháng. Hơn 70% khách hàng Cloud của Google cũng đang sử dụng AI và 13 triệu nhà lập trình đã phát triển sản phẩm với các mô hình tạo sinh của hãng này.