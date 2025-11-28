Tuần trước, Huawei đã công bố "Flex:ai", một công cụ điều phối mã nguồn mở được thiết kế để giải quyết vấn đề nan giải nhất của Trung Quốc hiện nay là sự thiếu hụt GPU cao cấp. Được xây dựng trên nền tảng Kubernetes và phát hành qua cộng đồng ModelEngine, Flex:ai không phải là phần cứng mới, mà là một "nhạc trưởng" thông minh giúp các hệ thống hiện có làm việc hiệu quả hơn.

Chip Ascend của Huawei.

Theo tuyên bố từ Huawei, nền tảng này có khả năng gộp chung sức mạnh của các GPU và NPU (bộ xử lý thần kinh), giúp tăng mức sử dụng trung bình của toàn hệ thống lên khoảng 30%. Đây được xem là bước đi chiến lược, chuyển trọng tâm từ chạy đua phần cứng sang tối ưu hóa phần mềm để lấp đầy khoảng trống mà các lệnh hạn chế xuất khẩu của Mỹ để lại.

Điểm đặc biệt của Flex:ai nằm ở khả năng ảo hóa linh hoạt. Thay vì lãng phí tài nguyên khi một tác vụ nhỏ chiếm dụng toàn bộ một GPU mạnh mẽ, Flex:ai sẽ "cắt nhỏ" các thẻ GPU hoặc NPU thành nhiều phiên bản tính toán ảo.

- Tối ưu hóa đa chiều: Các tác vụ nhỏ sẽ được xếp chồng lên nhau để chạy song song, tận dụng tối đa công suất. Ngược lại, các mô hình AI khổng lồ vượt quá khả năng của một chip đơn lẻ sẽ được trải rộng trên nhiều thẻ để xử lý đồng bộ.

- Hi Scheduler: Công cụ này đi kèm với một bộ lập lịch thông minh, có khả năng phân phối lại tài nguyên nhàn rỗi theo thời gian thực, đảm bảo không có sức mạnh tính toán nào bị lãng phí khi hàng đợi công việc vẫn còn.

Giới chuyên môn nhận định động thái này của Huawei có nét tương đồng với Run:ai - nền tảng đã được Nvidia thâu tóm vào năm 2024. Tuy nhiên, Huawei chọn hướng đi mã nguồn mở và tập trung vào khả năng tương thích chéo giữa các bộ tăng tốc khác nhau (gồm cả dòng chip Ascend "cây nhà lá vườn" và các GPU tiêu chuẩn khác).

Đáng chú ý nhất là tuyên bố đầy tham vọng của hãng khi cho rằng phần mềm này được trang bị để giúp Trung Quốc tạo ra một "chip AI analogue nhanh hơn 1.000 lần so với chip của Nvidia". Dù đây có thể là một cách ví von về hiệu suất tổng hợp hoặc một trường hợp sử dụng mô phỏng cụ thể, con số này cũng đủ để khiến giới công nghệ phải dè chừng.

Huawei tuyên bố gây sốc về việc tạo ra chip AI nhanh gấp 1.000 lần chip Nvidia.

Hiện tại, mã nguồn của Flex:ai vẫn chưa được công bố rộng rãi, và Huawei cũng chưa đưa ra các tài liệu kỹ thuật hay điểm chuẩn (benchmark) cụ thể để kiểm chứng. Cộng đồng công nghệ đang chờ đợi để xem liệu khả năng "cắt nhỏ" và tương thích của Flex:ai có thực sự mượt mà như lời đồn hay không, đặc biệt là khi kết hợp với các GPU phổ biến hiện nay.

Được biết, dự án này có sự đóng góp nghiên cứu từ các trường đại học hàng đầu Trung Quốc như Đại học Giao thông Thượng Hải, Đại học Giao thông Tây An và Đại học Hạ Môn.