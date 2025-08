Trong thời đại số, mạng xã hội và các nền tảng trực tuyến đã trở thành kênh tiếp cận thông tin chính yếu của hàng chục triệu người mỗi ngày. Tuy nhiên, song hành với sự tiện lợi là một thực tế đáng lo ngại: Tin giả, tin sai sự thật lan truyền với tốc độ chóng mặt.

Trong bối cảnh đó, nhu cầu kiểm chứng thông tin thông qua đối chiếu, xác minh độ chính xác của những gì chúng ta đọc, nghe và chia sẻ đã trở thành “hàng rào phòng thủ” thiết yếu. Và để thực hiện điều này một cách chính xác, nhanh chóng và khách quan, người dùng cần có trong tay những công cụ hỗ trợ đủ tin cậy.

Nhu cầu kiểm chứng thông tin đã trở thành “hàng rào phòng thủ” thiết yếu đối với mỗi người dùng trên không gian số.

Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đã nghiên cứu và phát triển ClaimPKG - một phương pháp kiểm chứng thông tin hiệu quả, có khả năng ứng dụng thực tiễn. Nghiên cứu này đã vượt qua hơn hơn 5.200 nghiên cứu trên toàn cầu để được giới thiệu trực tiếp tại ACL 2025.

Đây là một trong những hội nghị hàng đầu thế giới về xử lý ngôn ngữ tự nhiên (NLP), với tỷ lệ chấp nhận trình bày tại hội nghị chỉ 37%. Sự kiện quy tụ các chuyên gia công nghệ hàng đầu từ các ông lớn như Google, Meta, Huawei, IBM, Amazon, Oracle…

ClaimPKG kết hợp giữa đồ thị tri thức (Knowledge Graph) và mô hình ngôn ngữ lớn (LLM), giúp tăng độ chính xác từ 9% đến 12% so với các phương pháp hiện hành khi được thử nghiệm trên FactKG (tập dữ liệu chuẩn được cộng đồng công nghệ đánh giá cao trong kiểm chứng thông tin). Kết quả thử nghiệm này cho thấy tiềm năng ứng dụng mạnh mẽ của ClaimPKG trong việc nâng cao độ tin cậy của các hệ thống AI kiểm chứng thông tin trong tương lai.

Trước đó, tại Hội nghị NAACL 2025, Viettel AI cũng từng gây chú ý với VeGraph - một phương pháp kiểm chứng thông tin dựa trên nền tảng tri thức dạng văn bản như bài báo, tài liệu pháp lý,… VeGraph ghi nhận mức cải thiện 2 - 5% độ chính xác so với các phương pháp khác nhưng trong nhiều trường hợp, đặc biệt nếu dữ liệu văn bản thiếu cấu trúc rõ ràng thì quá trình kiểm chứng có thể tốn nhiều thời gian và khó đảm bảo tính nhất quán.

ClaimPKG được phát triển với cách tiếp cận dựa trên tri thức có cấu trúc, sử dụng đồ thị tri thức được định dạng rõ ràng theo mô hình “chủ thể - quan hệ - đối tượng”. Thông tin cần kiểm chứng sẽ được tách nhỏ và chuyển hóa thành một “đồ thị con giả”, sau đó hệ thống truy xuất các tri thức liên quan trong đồ thị tri thức, rồi để LLM suy luận và đưa ra kết luận cuối cùng. Quy trình này giúp tăng độ chính xác, nhất quán và đáng tin cậy trong việc kiểm chứng, đồng thời giảm gánh nặng tính toán cho LLM.

ClaimPKG nằm trong số 37% các công trình quốc tế được lựa chọn giới thiệu tại ACL 2025.

Những lợi thế về mặt kỹ thuật của ClaimPKG cũng chính là nền tảng để mở rộng ứng dụng thực tiễn. Trong lĩnh vực báo chí - truyền thông, công nghệ có thể hỗ trợ phóng viên, biên tập viên phát hiện tin giả, đối chiếu nguồn tin một cách nhanh chóng và có cơ sở.

Trong lĩnh vực y tế, pháp lý - những ngành yêu cầu thông tin chính xác tuyệt đối, công nghệ này có thể đóng vai trò như một “trợ lý kiểm chứng”, giúp tra cứu và xác thực tri thức chuyên ngành. Ngoài ra, ClaimPKG cũng có tiềm năng tích hợp vào các chatbot hay trợ lý ảo, giúp hệ thống đưa ra câu trả lời đáng tin cậy hơn, tránh việc “phán đoán mơ hồ”.

Hội nghị ACL 2025 (Annual Meeting of the Association for Computational Linguistics), diễn ra từ ngày 27/7 - 1/8 tại Vienna (Áo), là một trong những sự kiện uy tín và có tầm ảnh hưởng lớn nhất thế giới trong lĩnh vực NLP. Năm nay, chủ đề chính của hội nghị là “Khả năng tổng quát hóa của các mô hình NLP”, nhấn mạnh việc phát triển các mô hình có khả năng thích ứng và hiểu được dữ liệu, ngôn ngữ hay lĩnh vực mới.