Công nghệ AI mới của Google khiến ngành RAM “toát mồ hôi”
Google đã công bố một bài báo quan trọng về thuật toán TurboQuant có thể làm thay đổi mạnh mẽ nhu cầu về RAM.
TurboQuant là thuật toán nén dữ liệu nhằm giải quyết vấn đề dung lượng bộ nhớ dư thừa trong lưu trữ cặp khóa-giá trị cho các mô hình trí tuệ nhân tạo (AI) mà không làm giảm độ chính xác.
TurboQuant đang nhận được rất nhiều sự quan tâm từ cộng đồng công nghệ.
Theo bài báo, TurboQuant đã đạt được kết quả xuất sắc trong tất cả các bài kiểm tra hiệu năng, đồng thời giảm kích thước bộ nhớ cặp khóa-giá trị xuống ít nhất 6 lần. Cách làm này không chỉ giúp giảm yêu cầu bộ nhớ trong các tác vụ suy luận AI mà còn làm cho bộ nhớ và lưu trữ trở nên hữu ích hơn, từ đó có khả năng tăng cường quy trình làm việc của AI, đặc biệt trong môi trường tại chỗ.
Kho lưu trữ khóa-giá trị là một loại cơ sở dữ liệu cho phép truy cập nhanh chóng vào các giá trị liên kết với các khóa duy nhất. Các vectơ trong mô hình AI mô tả thuộc tính của dữ liệu, với kích thước nhỏ cho dữ liệu đơn giản và lớn hơn cho thông tin phức tạp. Việc nén dữ liệu thông qua lượng tử hóa vectơ giúp giảm kích thước của các vectơ đa chiều, từ đó tăng cường khả năng tìm kiếm và giảm chi phí bộ nhớ.
Công nghệ nén trong TurboQuant không chỉ giảm thiểu lượng bộ nhớ cần thiết mà còn cho phép xây dựng và truy vấn các chỉ mục vectơ lớn với bộ nhớ tối thiểu và độ chính xác cao. Tuy nhiên, bài báo cũng chỉ ra rằng chi phí xử lý cho việc nén và giải nén dữ liệu có thể ảnh hưởng đến hiệu suất tổng thể - một yếu tố cần được xem xét.
TurboQuant sẽ giúp giảm nhu cầu RAM tại các trung tâm dữ liệu lớn?
Khi mà bộ nhớ đang trở nên khan hiếm, việc áp dụng các phương pháp nén như TurboQuant có thể giảm yêu cầu bộ nhớ trong các trung tâm dữ liệu AI. Tình trạng thiếu hụt bộ nhớ cũng đã ảnh hưởng đến việc sản xuất máy tính cá nhân và các thiết bị thông minh, khi các công ty trung tâm dữ liệu lớn (Big Data) đã đặt trước nguồn cung bộ nhớ cho nhiều năm tới.
Bước tiến tiếp theo trong việc sử dụng AI là phát triển Tác nhân AI, có khả năng thực hiện các tác vụ cho người dùng cá nhân. Việc triển khai Tác nhân AI tại chỗ với yêu cầu bộ nhớ thấp hơn có thể thúc đẩy nhu cầu bộ nhớ tổng thể, đặc biệt trong tương lai. Do đó, việc tối ưu hóa bộ nhớ trong các hệ thống AI không chỉ giúp cải thiện hiệu suất mà còn có thể làm tăng nhu cầu bộ nhớ trong dài hạn.
Thị trường RAM toàn cầu đang trải qua một cuộc khủng hoảng chưa từng có: Giá DRAM đã tăng tới 171,8% trong vòng một năm, vượt xa tốc độ tăng giá của...
Nguồn: [Link nguồn]
-30/03/2026 06:50 AM (GMT+7)
