Νέα συσκευή “διαβάζει” το μυαλό και μετατρέπει τις σκέψεις σε ομιλία – Έγινε δοκιμή σε παράλυτη γυναίκα

Έκαναν δοκιμή της συσκευής σε μια γυναίκα που ονομάζεται Ann, η οποία έχει σοβαρή παράλυση και δεν μπορεί να μιλήσει

Μια ομάδα μηχανικών από το Πανεπιστήμιο της Καλιφόρνια εφηύρε ένα επαναστατικό σύστημα διεπαφής εγκεφάλου-υπολογιστή (BCI) με ηλεκτρόδια που προσκολλώνται στο τριχωτό της κεφαλής ενός ατόμου για τη μέτρηση της εγκεφαλικής δραστηριότητας και των εγκεφαλικών κυμάτων.

Τα εγκεφαλικά κύματα αναλύονται και στη συνέχεια μετατρέπονται σε ακουστική ομιλία από έναν υπολογιστή, ο οποίος στη συνέχεια τα μεταφράζει σε προφορικές λέξεις που διαβάζονται δυνατά από την τεχνητή νοημοσύνη.

Οι ερευνητές πιστεύουν ότι η νέα τεχνολογία θα μπορούσε να αποκαταστήσει την ικανότητα των παράλυτων ανθρώπων να επικοινωνούν μετατρέποντας την εγκεφαλική δραστηριότητα από τον κινητικό φλοιό σε ακουστική ομιλία.

Ο κινητικός φλοιός παίζει καθοριστικό ρόλο στον έλεγχο της ομιλίας και τα σήματα παράγονται ακόμη και όταν ένα άτομο έχει χάσει την ικανότητα να μιλάει.

Οι ερευνητές χρησιμοποίησαν προηγμένα μοντέλα τεχνητής νοημοσύνης για να συλλάβουν τα σήματα του εγκεφάλου σε αυτήν την περιοχή και να τα μετατρέψουν σε ήχο σε περίπου ένα δευτερόλεπτο, επιτρέποντας τη συνεχή έξοδο ομιλίας χωρίς καθυστερήσεις.

Έκαναν δοκιμή του BCI σε μια γυναίκα που ονομάζεται Ann, η οποία έχει σοβαρή παράλυση και δεν μπορεί να μιλήσει. Η γυναίκα είχε συμμετάσχει σε προηγούμενη μελέτη από την ίδια ομάδα, αλλά το σύστημα απόκρισής της τότε, είχε ως αποτέλεσμα χρόνο καθυστέρησης οκτώ δευτερολέπτων.

Η ανακάλυψη της διεπαφής εγκεφάλου-υπολογιστή (BCI) επιτρέπει τη ροή ομιλίας σχεδόν σε πραγματικό χρόνο χωρίς καθυστέρηση, χρησιμοποιώντας ηλεκτρόδια στο κρανίο για την καταγραφή της εγκεφαλικής δραστηριότητας από τον κινητικό φλοιό.

Η ανακάλυψη της διεπαφής εγκεφάλου-υπολογιστή (BCI) επιτρέπει τη ροή ομιλίας σχεδόν σε πραγματικό χρόνο χωρίς καθυστέρηση, χρησιμοποιώντας ηλεκτρόδια στο κρανίο για την καταγραφή της εγκεφαλικής δραστηριότητας από τον κινητικό φλοιό.
Δοκιμάστηκε σε μια γυναίκα που ονομάζεται Ann [στη φωτογραφία] που είναι παράλυτη και δεν μπορεί να μιλήσει


«Διαπιστώσαμε ότι το μοντέλο μας το κάνει αυτό καλά, κάτι που δείχνει ότι πράγματι μαθαίνει τα δομικά στοιχεία του ήχου ή της φωνής».

Η Ann, η οποία υπέστη ένα εγκεφαλικό το 2005 που διέκοψε τη ροή του αίματος στο εγκεφαλικό της στέλεχος και την παρέλυσε, είπε στους ερευνητές ότι η συσκευή τη βοήθησε να αισθάνεται ότι έχει μεγαλύτερο έλεγχο της επικοινωνίας και αμέσως την έκανε να αισθάνεται πιο συνδεδεμένη με το σώμα της.


Η τεχνολογία που αποκωδικοποιεί τα κύματα του εγκεφάλου σε προφορικές προτάσεις είναι ακόμα σε αρχικό στάδιο.

Σε προηγούμενες μελέτες, έχει αποδειχθεί ότι είχε περιορισμένη δυναμικότητα, αποκωδικοποιώντας μόνο λίγες λέξεις αλλά όχι φράσεις ή πλήρεις προτάσεις.

Αλλά η ομάδα από την Καλιφόρνια πιστεύει ότι η νέα μελέτη απόδειξης της ιδέας, που δημοσιεύτηκε στο περιοδικό Nature Neuroscience , θα τους βοηθήσει να «κάνουν πρόοδο σε κάθε επίπεδο».

Αρκετές διαφορετικές περιοχές του εγκεφάλου είναι υπεύθυνες για την ομιλία, συμπεριλαμβανομένου του κινητικού φλοιού, όπου οι λέξεις έχουν μοναδικά «δαχτυλικά αποτυπώματα».

Σε αυτήν την περιοχή, παράγονται συγκεκριμένες υπογραφές εγκεφαλικών κυμάτων για κάθε ήχο που βοηθούν στην αναγνώριση διαφορετικών λέξεων, όπως «γεια» και «αντίο».

Όταν ένα άτομο επιχειρεί για πρώτη φορά να μιλήσει, ο εγκέφαλος στέλνει σήματα στα χείλη, τη γλώσσα και τις φωνητικές χορδές και αλλάζει τα μοτίβα της αναπνοής για να μιλήσει.

Οι ερευνητές εκπαίδευσαν την τεχνητή νοημοσύνη του «φυσικού συνθέτη ομιλίας» χρησιμοποιώντας τα εγκεφαλικά κύματα της Ann για να τα αναλύσουν, να τα ερμηνεύσουν και να τα μετατρέψουν σε προφορικό λόγο.

Τοποθέτησαν ηλεκτρόδια στο κρανίο της Ann και κατέγραψαν τη δραστηριότητα των εγκεφαλικών κυμάτων στον κινητικό φλοιό της, καθώς προσπαθούσε να πει απλές φράσεις, όπως “Ε, πώς είσαι;”

Καθώς η Ann σχημάτιζε τις σκέψεις στο κεφάλι της και προσπαθούσε να τις μιλήσει, ο κινητικός φλοιός της παρήγαγε σήματα που τα “έπιαναν” τα ηλεκτρόδια. Οι ερευνητές ενσωμάτωσαν ήχο της φωνής της από πριν μείνει παράλυτη και η τεχνητή νοημοσύνη χρησιμοποίησε ένα μοντέλο μετατροπής κειμένου σε ομιλία για να δημιουργήσει προσομοιωμένο ήχο στη φυσική της φωνή

Οι ερευνητές ενσωμάτωσαν ήχο της φωνής της από πριν μείνει παράλυτη και η τεχνητή νοημοσύνη χρησιμοποίησε ένα μοντέλο μετατροπής κειμένου σε ομιλία για να δημιουργήσει προσομοιωμένο ήχο στη φυσική της φωνή

Καθώς η Ann σχημάτιζε προτάσεις στο κεφάλι της και, παρόλο που δεν είχε την ικανότητα να μιλήσει, ο εγκέφαλός της εκτόξευε εντολές για ομιλία που συλλαμβάνονταν από τα ηλεκτρόδια.

Οι ερευνητές χώρισαν διαφορετικά σήματα σε μικρά χρονικά τμήματα που αντιπροσωπεύουν διαφορετικά μέρη της πρότασης.

Ενσωμάτωσαν ήχο της φωνής της Ann πριν από την παράλυση και η τεχνητή νοημοσύνη χρησιμοποίησε ένα μοντέλο μετατροπής κειμένου σε ομιλία για να δημιουργήσει προσομοιωμένο ήχο στη φυσική της φωνή.

Στην Ann εμφανίστηκαν μηνύματα κειμένου, όπως “Γεια, πώς είσαι;” και έκανε νοερά πρόβα λέγοντάς τα—ενεργοποιώντας τον κινητικό της φλοιό σαν να άρθρωνε τις λέξεις, παρόλο που δεν παρήχθη ήχος.

Η AI έμαθε σιγά σιγά τα μοτίβα ομιλίας της. Σύντομα μπορούσε να πει λέξεις που δεν είχε εκπαιδευτεί να οπτικοποιεί, όπως Alpha και Bravo.

Το πρόγραμμα άρχισε επίσης να αναγνωρίζει λέξεις που δεν έβλεπε στο μυαλό της, συμπληρώνοντας τυχόν κενά για να σχηματίσει πλήρεις προτάσεις.

Ο Δρ Gopala Anumanchipalli, ηλεκτρολόγος μηχανικός στο UC Berkeley και συνεπικεφαλής της μελέτης, είπε: «Μπορούμε να δούμε σε σχέση με αυτό το σήμα πρόθεσης, μέσα σε 1 δευτερόλεπτο, βγάζουμε τον πρώτο ήχο.

“Και η συσκευή μπορεί να αποκωδικοποιεί συνεχώς την ομιλία, ώστε η Ann να μπορεί να συνεχίσει να μιλάει χωρίς διακοπή.”

Το πρόγραμμα ήταν επίσης εξαιρετικά ακριβές, αποτελώντας από μόνο του μια σημαντική ανακάλυψη, σύμφωνα με τον Δρ Littlejohn: «Προηγουμένως, δεν ήταν γνωστό εάν η κατανοητή ομιλία μπορούσε να μεταδοθεί από τον εγκέφαλο σε πραγματικό χρόνο».

Η τεχνητή νοημοσύνη έμαθε σταδιακά τα μοτίβα ομιλίας της, επιτρέποντάς της να λέει λέξεις που δεν είχε εκπαιδευτεί να οπτικοποιεί. Άρχισε επίσης να αναγνωρίζει λέξεις που δεν είχε σκεφτεί συνειδητά, συμπληρώνοντας κενά για να δημιουργήσει πλήρεις προτάσεις

Η τεχνολογία BCI έχει τραβήξει το ενδιαφέρον επιστημόνων και τεχνολογικών κολοσσών.

Το 2023, μια ομάδα μηχανικών στην κοινοπραξία BrainGate του Πανεπιστημίου Brown εμφύτευσε με επιτυχία αισθητήρες στον εγκεφαλικό φλοιό του Pat Bennett, ο οποίος έχει ALS.

Κατά τη διάρκεια 25 συνεδριών εκπαίδευσης, ένας αλγόριθμος τεχνητής νοημοσύνης αποκωδικοποίησε ηλεκτρικά σήματα από τον εγκέφαλο του Bennett, μαθαίνοντας να αναγνωρίζει φωνήματα – η βασική ομιλία ακούγεται σαν “sh” και “th” – με βάση μοτίβα νευρικής δραστηριότητας.

Στη συνέχεια, τα αποκωδικοποιημένα εγκεφαλικά κύματα τροφοδοτήθηκαν σε ένα γλωσσικό μοντέλο, το οποίο τα συγκέντρωσε σε λέξεις και εμφάνιζε την ομιλία της που προοριζόταν σε μια οθόνη.

Όταν το λεξιλόγιο περιοριζόταν στις 50 λέξεις, το ποσοστό λάθους ήταν περίπου εννέα τοις εκατό, αλλά αυξήθηκε στο 23 τοις εκατό όταν το λεξιλόγιο επεκτάθηκε στις 125.000 λέξεις, περιλαμβάνοντας περίπου κάθε λέξη που θα ήθελε να πει ένα άτομο, κατέληξαν οι ερευνητές.

Τα αποτελέσματα της μελέτης δεν έδωσαν ακριβή αριθμό λέξεων όταν ολοκληρώθηκε η εκπαίδευση, αλλά οι ερευνητές γνωρίζουν τώρα ότι τα εργαλεία μηχανικής μάθησης είναι ικανά να αναγνωρίζουν χιλιάδες λέξεις.

Τα αποτελέσματα απέχουν πολύ από το να είναι τέλεια, αλλά πιστεύουν ότι τα ευρήματά τους αποτέλεσαν ένα σημαντικό βήμα προς την τελειοποίηση των συστημάτων εγκεφαλικών κυμάτων σε ομιλία.

(photo: pixabay)

ΠΟΛΙΤΙΚΟΛΟΓΙΕΣ

ΠΡΕΠΕΙ ΝΑ ΔΙΑΒΑΣΕΤΕ

ΠΑΡΑΞΕΝΑ

LATEST

Κύρια Θέματα

ΕΥΚΑΙΡΙΕΣ ΑΓΟΡΩΝ

Κάθε μέρα μαζί