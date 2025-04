Google vừa chính thức tung ra bản preview của mô hình Gemini 2.5 Flash, một động thái được xem là bước tiến quan trọng trong cuộc đua AI. Được công bố lần đầu tại sự kiện Cloud Next tuần trước, phiên bản mới này không chỉ cải thiện đáng kể về hiệu năng mà còn mang đến một khái niệm độc đáo: mô hình suy luận lai (hybrid) đầu tiên của Google.

Google ngày càng nâng tầm sức mạnh của Gemini AI.

Hiện tại, các nhà phát triển và người dùng đã có thể trải nghiệm Gemini 2.5 Flash preview thông qua Gemini API (trên Google AI Studio và Vertex AI), cũng như qua bộ chọn mô hình trong các ứng dụng Gemini và tích hợp với Canvas để tinh chỉnh tài liệu, mã nguồn.

Điểm nhấn đặc biệt của Gemini 2.5 Flash là khả năng "lai" độc đáo. Đây là mô hình đầu tiên của Google cho phép các nhà phát triển có thể chủ động bật hoặc tắt hoàn toàn khả năng "suy luận" (reasoning) của AI. Theo Google, sự linh hoạt này giúp tối ưu hóa phản hồi dựa trên các yếu tố mong muốn như chất lượng đầu ra, chi phí vận hành và độ trễ. Nếu tắt suy luận, Gemini 2.5 Flash có thể hoạt động như một bản nâng cấp trực tiếp, thay thế cho Gemini 2.0 Flash trước đó.

Google tự tin khẳng định Gemini 2.5 Flash đạt tỷ lệ hiệu năng trên chi phí (performance-to-cost) xuất sắc. Mức giá công ty đưa ra cho bản preview cũng rất cạnh tranh:

- 0,15 USD cho mỗi 1 triệu token đầu vào.

- 0,60 USD cho mỗi 1 triệu token đầu ra (khi tắt suy luận).

- 3,50 USD cho mỗi 1 triệu token đầu ra (khi bật suy luận).

Mức giá này, đặc biệt là khi bật suy luận, thấp hơn đáng kể so với nhiều mô hình đối thủ. Dù chỉ là bản xem trước, Logan Kilpatrick từ Google cho biết model này đã "cho thấy những bước tiến vượt bậc so với 2.0 Flash".

Dựa trên các bảng điểm benchmark được công bố, Gemini 2.5 Flash thể hiện sự cải thiện rõ rệt so với phiên bản 2.0 và tỏ ra rất cạnh tranh so với các mô hình tiên phong khác như Claude Sonnet 3.7 của Anthropic hay Grok 3 Beta. Mặc dù mô hình o4-mini mới ra mắt của OpenAI có thể nhỉnh hơn ở một số bài kiểm tra hiệu năng, nhưng đi kèm với đó là mức chi phí cao hơn đáng kể so với Gemini 2.5 Flash.

Sức mạnh điểm hiệu suất của Gemini 2.5 Flash so với các mô hình khác.

Sự ra mắt của Gemini 2.5 Flash preview đánh dấu nỗ lực của Google trong việc cung cấp các giải pháp AI mạnh mẽ, linh hoạt và hiệu quả về chi phí, hứa hẹn mang đến nhiều lựa chọn hơn cho các nhà phát triển và người dùng trong bối cảnh thị trường AI đang ngày càng sôi động.