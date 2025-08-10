Khác với những trận đấu kinh điển giữa siêu máy tính và con người, một giải đấu cờ vua vừa kết thúc đã cho chúng ta cái nhìn sâu sắc hơn về trí tuệ của chính những "trợ lý AI" mà chúng ta đang sử dụng. Trong trận chiến cân não này, mô hình của OpenAI đã chứng tỏ vị thế của mình khi đánh bại Grok của tỷ phú Elon Musk một cách thuyết phục, qua đó hé lộ nhiều điều về cuộc đua AI hiện tại.

Điểm đặc biệt của giải đấu trên nền tảng Kaggle lần này là các "kỳ thủ" không phải là những chương trình được tạo ra chỉ để chơi cờ. Chúng là các LLM đa dụng như ChatGPT, Grok, Gemini... được thiết kế cho hàng ngàn tác vụ hàng ngày.

Vì vậy, giải đấu này không chỉ đơn thuần đo tốc độ tính toán, mà là một bài kiểm tra khắc nghiệt về khả năng suy luận logic, lập kế hoạch chiến lược và khả năng học hỏi từ các quy tắc phức tạp – những kỹ năng cốt lõi của một trí tuệ nhân tạo toàn diện.

Grok 4 đã thua o3-mini trong màn thi đấu chung kết cờ vua AI.

Theo đó, Grok 4 của xAI (công ty của Elon Musk) đã có một khởi đầu như mơ và được đánh giá là ứng cử viên nặng ký nhất. Tuy nhiên, trong trận chung kết đối đầu với mô hình o3 của OpenAI, Grok đã bất ngờ "sụp đổ".

Các chuyên gia và cả đại kiện tướng Hikaru Nakamura đều nhận xét Grok đã có những nước đi "ngớ ngẩn" và liên tục mắc lỗi sơ đẳng như để mất quân hậu. Sự thiếu ổn định này đặt ra một câu hỏi lớn về độ tin cậy của các mô hình AI khi đối mặt với các tình huống phức tạp và áp lực cao. Trong khi đó, mô hình của OpenAI lại thể hiện một lối chơi vững vàng và chắc chắn hơn hẳn.

Nói về trận thua, tỷ phú Elon Musk đã nhanh chóng tuyên bố rằng xAI "gần như không được huấn luyện về cờ vua". Dù lời nói này có thể nhằm giảm nhẹ thất bại, nó cũng phần nào cho thấy sự khác biệt trong chiến lược của các công ty.

Tuy nhiên, bất kể mức độ đầu tư là bao nhiêu, kết quả vẫn là một chiến thắng mang tính biểu tượng cho OpenAI. Nó không chỉ mang lại cho họ quyền "khoe khoang" trong cuộc đối đầu trực tiếp với kình địch xAI, mà còn là một minh chứng công khai cho thấy mô hình của họ có khả năng suy luận và giải quyết vấn đề một cách ổn định.