Group News: Tin copy

Các nhà khoa học đang đạt được những bước tiến quan trọng trong công nghệ giao diện não - máy tính (BCI), với một hệ thống mới có khả năng dịch suy nghĩ của con người thành văn bản hoặc âm thanh.

AI sẽ thay thế phần lớn con người, sau đó thì sao nữa?
bci.jpeg
Ý tưởng biến suy nghĩ thành văn bản có thể trở thành hiện thực trong tương lai

Về bản chất, đây là một “bộ giải mã lời nói thầm”, được phát triển bởi các nhà nghiên cứu từ nhiều viện ở Mỹ. Trong các thử nghiệm trên 4 tình nguyện viên bị liệt nặng, hệ thống đã đạt độ chính xác lên tới 74% trong việc chuyển đổi ý nghĩ thành giọng nói nghe được.

Ứng dụng tiềm năng của công nghệ này là giúp những người gặp trở ngại về ngôn ngữ hoặc vận động có thể giao tiếp hiệu quả hơn bao giờ hết, dù hiện vẫn còn nhiều việc phải làm để nâng cao độ chính xác và khả năng cá nhân hóa của hệ thống.

Thí nghiệm phương pháp mới

Trước đây, các BCI chủ yếu dựa vào hoạt động não được tạo ra khi người liệt cố gắng nói hoặc viết, dù cơ thể họ không thể thực hiện hành động đó. Công nghệ mới này tiến gần hơn một bước tới nguồn gốc thật sự của ngôn ngữ.

Nhà thần kinh học Benyamin Meschede-Krasa, Đại học Stanford, cho biết: “Nếu bạn chỉ cần nghĩ đến lời nói thay vì phải cố gắng phát âm, điều đó có thể dễ dàng và nhanh hơn nhiều cho người sử dụng”.

BCI mới dựa trên một thiết bị cấy ghép, có chức năng đo hoạt động thần kinh và phát hiện các mô hình liên quan đến những đơn vị ngôn ngữ nhỏ nhất gọi là âm vị. Từ các âm vị này, hệ thống có thể xây dựng thành câu.

Các nhà nghiên cứu đã sử dụng máy học để huấn luyện BCI kết nối tín hiệu não với từ ngữ khi 4 người tham gia nghĩ đến chúng, tập trung vào vỏ não vận động - vùng não chịu trách nhiệm cho chuyển động, bao gồm cả việc nói.

Kết quả cho thấy có sự trùng lặp giữa một số mẫu hoạt động não khi các tình nguyện viên cố gắng nói (liên quan đến tín hiệu điều khiển cơ) và khi họ chỉ tưởng tượng từ ngữ trong đầu (không cần dùng cơ).

Dù có sự trùng lặp, hai loại tín hiệu này vẫn có thể phân biệt. Kết hợp thêm các phép tính xác suất về những âm vị và từ thường đi liền với nhau, hệ thống BCI mới có thể nhận diện tới 125.000 từ chỉ dựa trên “lời nói thầm” trong não.

Frank Willett, nhà thần kinh học thuộc Đại học Stanford cho biết: “Những mẫu hoạt động này giống như một phiên bản nhỏ hơn của các mẫu được kích hoạt khi con người thực sự cố gắng nói. Chúng tôi phát hiện rằng có thể giải mã những tín hiệu này đủ tốt để chứng minh nguyên lý, dù chưa thể sánh bằng khi người tham gia thực sự cố gắng phát âm”.

Còn chặng đường dài phía trước

Dù vậy, công nghệ vẫn còn một chặng đường dài. Trong nhiều trường hợp, độ chính xác của BCI thấp hơn nhiều so với mức 74% tối đa. Tuy nhiên, nhờ cải tiến thiết bị cấy ghép và lập bản đồ rộng hơn các khu vực não liên quan đến suy nghĩ, nhóm nghiên cứu tin rằng hệ thống có thể được nâng cấp nhanh chóng trong vài năm tới.

Hiện nay, lĩnh vực này đang chứng kiến nhiều tiến bộ. Đầu năm nay, một nghiên cứu khác cũng đã công bố công nghệ giải mã suy nghĩ theo thời gian thực, dù chỉ áp dụng cá nhân hóa cho một đối tượng duy nhất.

Willett nói: “Tương lai của BCI rất sáng sủa. Công trình này mang lại hy vọng thực sự rằng một ngày nào đó BCI ngôn ngữ có thể khôi phục khả năng giao tiếp trôi chảy, tự nhiên và thoải mái như một cuộc trò chuyện bình thường”.

Một thách thức khác là nguy cơ hệ thống dịch, ghi lại hoặc phát ra những “độc thoại nội tâm” mà con người vốn muốn giữ riêng tư – điều không ai mong muốn ở một BCI.

Nhóm nghiên cứu gợi ý các biện pháp bảo mật, chẳng hạn nghĩ đến một “mật khẩu đặc biệt” để bật hoặc tắt giải mã. Ý tưởng này đã được thử nghiệm trong thí nghiệm và đạt độ chính xác 98%.

Các phương pháp chính trong BCI

Sử dụng cấy ghép điện cực (Invasive BCI): Đây là phương pháp phổ biến và đạt độ chính xác cao nhất hiện nay. Các nhà khoa học cấy các điện cực siêu nhỏ vào vỏ não của người tham gia (thường là những người bị liệt nặng). Các điện cực này có thể ghi lại hoạt động thần kinh ở mức độ chi tiết cao, từ đó cho phép giải mã suy nghĩ về lời nói. Nghiên cứu trong bài là một ví dụ điển hình của phương pháp này. Họ ghi lại các tín hiệu não liên quan đến "tiếng nói nội tâm" và chuyển chúng thành văn bản hoặc âm thanh.

Sử dụng thiết bị không xâm lấn (Non-invasive BCI): Các phương pháp này sử dụng các thiết bị bên ngoài đầu, chẳng hạn như máy quét fMRI (cộng hưởng từ chức năng) hoặc EEG (điện não đồ).

fMRI: Một nghiên cứu đột phá của các nhà khoa học tại Đại học Texas (Mỹ) đã sử dụng fMRI để đào tạo một hệ thống AI có khả năng dịch suy nghĩ thành văn bản. Hệ thống này không tạo ra bản sao chép chính xác mà tập trung vào việc ghi lại những ý tưởng hoặc ý nghĩa tổng thể của suy nghĩ.

EEG: Một số nghiên cứu khác đã sử dụng EEG để giải mã tín hiệu não thành văn bản. Mặc dù độ chính xác chưa cao bằng phương pháp cấy ghép, nhưng EEG có lợi thế là không cần phẫu thuật và dễ tiếp cận hơn.

Theo MTG


Comments powered by CComment

Tin liên quan

Bài viết Khác

Trang Thông Tấn Xã Việt Nam là cơ quan XÃ HỘI DÂN LUẬN chính thức của CỘNG ĐỒNG NGƯỜI VIỆT nhằm cung cấp thông tin nhanh chính xác.

Quý vị cần liên hệ về quảng cáo và góp ý với chúng tôi, xin gửi email tới This email address is being protected from spambots. You need JavaScript enabled to view it.