Công nghệ

AI có thể đọc suy nghĩ và biến nó thành văn bản?

Trâm Anh • 02/05/2023 - 22:14

Các nhà khoa học đã tìm ra cách sử dụng phương pháp quét não kết hợp trí tuệ nhân tạo để ghi lại suy nghĩ của một người và ghi lại thành văn bản.

Bộ giải mã có thể tái tạo giọng nói bằng cách sử dụng dữ liệu quét cộng hưởng từ.

Ngày 1/5, các nhà khoa học tại Đại học Texas, Austin (Mỹ), cho biết họ đang có bước tiến quan trọng trong việc phát triển cách mới để khôi phục giọng nói ở những người gặp khó khăn trong giao tiếp do đột quỵ hoặc bệnh thần kinh vận động mà không cần áp dụng phương pháp cấy ghép não xâm lấn.

Nhóm nghiên cứu cho biết họ đã đưa dữ liệu thu thập được vào một mô hình ngôn ngữ mạng thần kinh, sử dụng GPT-1 - tiền thân của công nghệ AI được sử dụng để xây dựng ChatGPT. Sau đó, mô hình sẽ dự đoán cách não bộ của con người phản ứng với lời nói, thu hẹp các tùy chọn cho đến khi tìm được phản hồi phù hợp nhất.

Tiến sĩ Alexander Huth, một nhà thần kinh học, người đứng đầu nghiên cứu tại Đại học Texas ở Austin, cho biết: “Chúng tôi thực sự bị sốc khi nó hoạt động tốt như vậy. Tôi đã làm việc này trong 15 năm… Vì vậy thật bất ngờ và thú vị khi cuối cùng nó cũng thành công.”

Để kiểm tra độ chính xác của mô hình, ba tình nguyện viên tham gia nghiên cứu được yêu cầu nằm trong một máy chụp cộng hưởng từ và lắng nghe một câu chuyện. Kết quả là bộ giải mã bằng AI có thể khôi phục ý chính những điều mà các tình nguyện viên đang nghe.

Sau đó, chính những tình nguyện viên này được nghe một câu chuyện mới hoặc tưởng tượng đang kể một câu chuyện và bộ giải mã được sử dụng để tạo văn bản từ hoạt động của não. Chỉ trong một thời gian ngắn, AI đã cho ra một văn bản khớp với ý nghĩ của ba tình nguyện viên này.

“Hệ thống của chúng tôi hoạt động ở cấp độ ý tưởng, ngữ nghĩa, ý nghĩa”, Huth nói. “Đây là lý do tại sao những gì chúng tôi nhận được không phải là những từ chính xác, mà là ý chính”.

Chẳng hạn, khi một tình nguyện viên nghĩ trong đầu câu “Tôi chưa có bằng lái xe”, bộ giải mã sẽ dịch chúng thành “Cô ấy thậm chí còn chưa bắt đầu học lái xe”. Trong một trường hợp khác, câu “Tôi không biết phải hét lên, khóc hay bỏ chạy. Vì thế, tôi nói: 'Hãy để tôi yên!'” được giải mã thành “Bắt đầu la hét và khóc, và sau đó cô ấy chỉ nói: 'Tôi đã bảo bạn để tôi yên.'”

Đôi khi bộ giải mã gặp khó khăn trong một số khía cạnh của ngôn ngữ, bao gồm cả đại từ. Huth nói: “Bộ giải mã không phân biệt được ngôi thứ nhất hay ngôi thứ ba, nam hay nữ. Tại sao nó lại gặp khó khăn ở chỗ này thì chúng tôi không biết.”

Tuy nhiên, để xoa dịu nỗi lo về quyền riêng tư khi bị "đọc trộm" suy nghĩ, các nhà nghiên cứu đã tiến hành thử nghiệm, chứng minh rằng bộ giải mã bằng AI của họ không sử dụng được ở những người mà AI chưa được "đào tạo" về hoạt động não.

Nghĩa là AI chỉ có thể đọc được "ý chính" trong suy nghĩ của những người mà nó đã được đào tạo để đọc thông tin, những người nó chưa được đào tạo thì không thể đọc được.

Ngoài ra, con người cũng có thể dễ dàng đánh lừa bộ giải mã. Cụ thể, nhóm nghiên cứu cho ba tình nguyện viên nghe podcast, đồng thời yêu cầu họ tự đếm số, đặt tên hoặc kể một câu chuyện khác trong đầu. Kết quả, AI không thể đọc được họ đang nghĩ gì.

Điều này sẽ giúp con người tiến gần hơn với tương lai máy móc có thể đọc và ghi lại suy nghĩ của con người. Các nhà nghiên cứu cho biết, mục tiêu chính của nghiên cứu này là giúp đỡ những người mất khả năng giao tiếp.

Giáo sư Shinji Nishimoto, Đại học Osaka, người tiên phong trong việc tái tạo hình ảnh thị giác từ hoạt động của não, đã gọi kết quả nghiên cứu này là một “bước tiến đáng kể”. Ông nói: “Kết quả nghiên cứu này cho thấy bộ não thể hiện thông tin ngôn ngữ liên tục trong quá trình nhận thức và tưởng tượng. Đây là một phát hiện không tầm thường và có thể là cơ sở để phát triển giao diện não-máy tính”.

Trâm Anh