Công nghệ 'ghi chú suy nghĩ' biến hình ảnh trong tâm trí thành văn bản

Nhà khoa học Nhật Bản phát triển công nghệ quét não và AI để chuyển hình ảnh trong tâm trí con người thành những câu mô tả chính xác.

Dù công nghệ hiện đại có những tiến bộ trong việc sử dụng quét hoạt động não để dịch những dòng suy nghĩ thành văn bản, nhưng việc chuyển những hình ảnh phức tạp trong tâm trí thành ngôn ngữ vẫn là một thách thức.

Tuy nhiên, ông Tomoyasu Horikawa, nhà nghiên cứu tại Phòng thí nghiệm Khoa học Truyền thông của công ty viễn thông NTT ở ngoại ô Tokyo (Nhật Bản), phát triển phương pháp mới được gọi là “ghi chú suy nghĩ”.

Phương pháp này hoạt động bằng cách sử dụng trí tuệ nhân tạo (AI) để tạo ra văn bản mô tả phản ánh thông tin trong não về các chi tiết trực quan như đồ vật, địa điểm, hành động và sự kiện, cũng như mối quan hệ giữa chúng.

Chụp cộng hưởng từ chức năng (fMRI) là một kỹ thuật không xâm lấn dùng để đo hoạt động của não. (Ảnh: CNN)

Nhà nghiên cứu Horikawa bắt đầu phân tích hoạt động não của bốn người đàn ông và hai người phụ nữ Nhật Bản trong độ tuổi từ 22 đến 37, quét não của họ khi xem các đoạn video. Những người tham gia đã xem 2.180 video không có âm thanh, mỗi video dài vài giây và có nội dung đa dạng về đồ vật, cảnh vật và hành động.

Các mô hình ngôn ngữ lớn sau đó lấy phụ đề của các đoạn video và chuyển các phụ đề đó thành chuỗi số.

Ông Horikawa tiếp tục huấn luyện các mô hình AI đơn giản hơn, riêng biệt, được gọi là “bộ giải mã”, để đối chiếu hoạt động não được quét liên quan đến các đoạn video với các chuỗi số.

Sau đó, ông sử dụng các bộ giải mã để diễn giải hoạt động não của những người tham gia nghiên cứu trong khi họ xem hoặc nhớ lại các video mà AI chưa gặp trong quá trình huấn luyện. Một thuật toán khác được thiết lập để dần dần tạo ra các chuỗi từ phù hợp nhất với hoạt động não đã được giải mã.

Khi AI học hỏi từ dữ liệu, công cụ văn bản mô tả ngày càng trở nên tốt hơn trong việc sử dụng các bản quét não để mô tả các video mà người tham gia đã xem.

“Đây là một bước tiến mới mà theo tôi, chúng ta có thể gọi một cách chính đáng là đọc não hoặc đọc suy nghĩ”, Marcello Ienca, Giáo sư về đạo đức trí tuệ nhân tạo tại Đại học Kỹ thuật Munich (Đức), nói với CNN.

Công nghệ này có thể được sử dụng để hỗ trợ những người mắc chứng mất ngôn ngữ, những người gặp khó khăn trong việc diễn đạt ngôn ngữ do tổn thương xung quanh mạng lưới ngôn ngữ; hoặc bệnh xơ cứng teo cơ (ALS), một bệnh thoái hóa thần kinh tiến triển ảnh hưởng đến khả năng nói, theo nghiên cứu.

“Tôi cho rằng nghiên cứu này mở đường cho một số biện pháp can thiệp sâu dành cho những người gặp khó khăn trong giao tiếp, bao gồm cả những người tự kỷ không nói được. Tuy nhiên, chúng ta phải sử dụng nó cẩn thận, đảm bảo không xâm phạm quyền riêng tư và sự đồng thuận”, nhà tâm lý học Scott Barry Kaufman, giảng viên tại trường Barnard College ở New York cho biết.

Thách thức về quyền riêng tư

Nghiên cứu lưu ý, sự thành công của phương pháp "đọc tâm trí" có thể được áp dụng để giải mã suy nghĩ của trẻ sơ sinh hoặc động vật, hoặc nội dung của giấc mơ “làm dấy lên những lo ngại về đạo đức” liên quan đến quyền riêng tư, với khả năng tiết lộ suy nghĩ của một cá nhân trước khi họ nói ra.

AI học hỏi từ dữ liệu, công cụ văn bản mô tả ngày càng trở nên tốt hơn trong việc sử dụng các bản quét não. (Ảnh: MH)

Nếu trong tương lai công nghệ này được sử dụng ngoài mục đích y sinh học, “tôi nghĩ đây là thách thức về quyền riêng tư tối thượng”, Marcello Ienca cho hay. Ông nói thêm rằng nhiều công ty, chẳng hạn như Neuralink, công ty khởi nghiệp cấy ghép não của Elon Musk, đang công khai tuyên bố sẽ sớm phát triển cấy ghép thần kinh cho dân số nói chung.

“Nếu chúng ta đạt được điều đó, thì chúng ta cần phải có những quy tắc rất, rất nghiêm ngặt khi cấp quyền truy cập vào tâm trí và não bộ của con người”, ông Lenca nói.

Một nghiên cứu được công bố trên tạp chí Cell vào tháng 8/2025 cho thấy rằng việc “rò rỉ” những suy nghĩ riêng tư bên trong trong quá trình giải mã có thể được ngăn chặn bằng một cơ chế trong đó người dùng chỉ nghĩ đến một từ khóa cụ thể để mở khóa công cụ giải mã khi được yêu cầu.

“Khoa học thần kinh đang phát triển nhanh chóng với tiềm năng hỗ trợ rất lớn, nhưng việc bảo vệ quyền riêng tư về tinh thần và tự do tư tưởng không thể chờ đợi”, nhà khoa học xã hội Łukasz Szoszkiewicz, giám đốc phụ trách các vấn đề châu Âu tại Tổ chức Neurorights ở New York, cho biết.

“Chúng ta nên coi dữ liệu thần kinh là dữ liệu nhạy cảm mặc định, yêu cầu sự đồng ý rõ ràng có giới hạn mục đích và ưu tiên xử lý trên thiết bị với các cơ chế ‘mở khóa’ do người dùng kiểm soát.

Việc dựa vào AI tạo ra thêm những thách thức về quy định và an ninh mạng, đồng thời nhấn mạnh sự cần thiết của một khung pháp lý bổ sung, dành riêng cho AI”, ông Szoszkiewicz chia sẻ với CNN.

Tuy nhiên, nhà nghiên cứu Horikawa lưu ý phương pháp được sử dụng trong nghiên cứu của ông yêu cầu thu thập lượng lớn dữ liệu, với sự hợp tác của những người tham gia tích cực.

"Mặc dù công nghệ này hữu ích cho nghiên cứu khoa học thần kinh, nhưng nó không chính xác lắm cho việc sử dụng thực tế”, ông nói.

Ngoài ra, các video được sử dụng trong nghiên cứu chủ yếu là các cảnh điển hình, ví dụ như một con chó cắn người, nhưng không bao gồm các cảnh bất thường như một người đàn ông cắn con chó. Do đó, vẫn chưa rõ liệu kỹ thuật này có thể được sử dụng để thu thập các hình ảnh tinh thần ít dự đoán được hay không.

“Một số người có thể lo lắng công nghệ này gây rủi ro nghiêm trọng đối với quyền riêng tư về tinh thần, nhưng thực tế phương pháp hiện tại không thể dễ dàng đọc được suy nghĩ riêng tư của một người”, ông Horikawa nói.