Εγκεφαλικά εμφυτεύματα που βοηθούν παράλυτους ανθρώπους να μιλήσουν μόλις έσπασαν νέα ρεκόρ

Περίληψη άρθρου:
Δύο νέες μελέτες που δημοσιεύονται στο περιοδικό Nature καταδεικνύουν ότι οι συσκευές με τεχνητή νοημοσύνη μπορούν να βοηθήσουν τα παραλυμένα άτομα να επικοινωνούν ταχύτερα και με μεγαλύτερη ακρίβεια. Αποκωδικοποιώντας τα νευρικά σήματα που σχετίζονται με τις κινήσεις του προσώπου που εμπλέκονται στην ομιλία, οι διεπαφές εγκεφάλου-υπολογιστή (BCIs) επέτρεψαν σε δύο παράλυτες γυναίκες να επικοινωνούν μέσω ενός υπολογιστή με ταχύτητα που πλησιάζει την κανονική συνομιλία. Οι ερευνητικές ομάδες του Πανεπιστημίου του Στάνφορντ και του Πανεπιστημίου του Σαν Φρανσίσκο χρησιμοποίησαν διαφορετικά BCIs, συμπεριλαμβανομένων εμφυτευμένων ηλεκτροδίων και επιφανειακών συστοιχιών, για να μεταφράσουν την επιδιωκόμενη ομιλία των συμμετεχόντων σε λέξεις που εμφανίζονται σε μια οθόνη ή σε ακουστική ομιλία που εκφωνείται από έναν υπολογιστή. Αν και υπάρχουν ακόμη τεχνολογικές προκλήσεις που πρέπει να ξεπεραστούν, οι εξελίξεις αυτές αποτελούν ένα ελπιδοφόρο βήμα προς την αποκατάσταση της ομιλίας σε πραγματικό χρόνο για τα παραλυμένα άτομα.
Κύρια σημεία του άρθρου:
- Δύο νέες μελέτες έδειξαν ότι οι συσκευές με τεχνητή νοημοσύνη μπορούν να βοηθήσουν τους παράλυτους να επικοινωνούν ταχύτερα και με μεγαλύτερη ακρίβεια.
- Οι συσκευές αποωδικοποιούν την προβλεπόμενη ομιλία τους με ρυθμό 62 και 78 λέξεων ανά λεπτό, αντίστοιχα -πολλές φορές ταχύτερα από το προηγούμενο ρεκόρ.
- Η μελέτη του Στάνφορντ χρησιμοποίησε έναν μικροσκοπικό αισθητήρα με 64 τρίχες που μοιάζουν με βελόνες για να συλλέξει τη δραστηριότητα μεμονωμένων νευρώνων.
- Η μελέτη του UCSF χρησιμοποίησε ένα ορθογώνιο, λεπτό σαν χαρτί, με 253 ηλεκτρόδια για να ανιχνεύσει τη δραστηριότητα πολλών νευρώνων σε ολόκληρο τον φλοιό της ομιλίας.
- Και οι δύο μελέτες έδειξαν πολλά υποσχόμενα αποτελέσματα, αλλά υπάρχουν ακόμη κάποια τεχνολογικά εμπόδια για τη δημιουργία μιας εμφυτεύσιμης συσκευής με αυτές τις δυνατότητες.
Αναλυτικά το άρθρο:
Δύο νέες μελέτες δείχνουν ότι οι συσκευές με τεχνητή νοημοσύνη μπορούν να βοηθήσουν τους παράλυτους ανθρώπους να επικοινωνούν ταχύτερα και με μεγαλύτερη ακρίβεια.
Η ΠΑΡΑΛΥΣΗ είχε στερήσει από τις δύο γυναίκες την ικανότητά τους να μιλούν. Για τη μία, η αιτία ήταν η αμυοτροφική πλευρική σκλήρυνση ή ALS, μια ασθένεια που επηρεάζει τους κινητικούς νευρώνες. Η άλλη είχε υποστεί εγκεφαλικό επεισόδιο στο στέλεχος του εγκεφάλου της. Αν και δεν μπορούν να προφέρουν καθαρά, θυμούνται πώς να διατυπώνουν λέξεις.
Τώρα, αφού προσφέρθηκαν εθελοντικά να λάβουν εγκεφαλικά εμφυτεύματα, και οι δύο είναι σε θέση να επικοινωνούν μέσω υπολογιστή με ταχύτητα που πλησιάζει το ρυθμό μιας κανονικής συνομιλίας. Αναλύοντας τη νευρική δραστηριότητα που σχετίζεται με τις κινήσεις του προσώπου που εμπλέκονται στην ομιλία, οι συσκευές αποκωδικοποιούν την προβλεπόμενη ομιλία τους με ρυθμό 62 και 78 λέξεων ανά λεπτό, αντίστοιχα -πολλές φορές ταχύτερα από το προηγούμενο ρεκόρ. Οι περιπτώσεις τους περιγράφονται λεπτομερώς σε δύο εργασίες που δημοσιεύθηκαν την Τετάρτη από διαφορετικές ομάδες στο περιοδικό Nature.
"Είναι πλέον δυνατό να φανταστούμε ένα μέλλον όπου θα μπορούμε να αποκαταστήσουμε τη ρευστή συνομιλία σε κάποιον με παράλυση, επιτρέποντάς του να λέει ελεύθερα ό,τι θέλει να πει με αρκετά υψηλή ακρίβεια ώστε να γίνεται αξιόπιστα κατανοητός", δήλωσε ο Frank Willett, ερευνητής στο μεταφραστικό εργαστήριο νευρικής προσθετικής του Πανεπιστημίου του Στάνφορντ, κατά τη διάρκεια ενημέρωσης των μέσων ενημέρωσης την Τρίτη. Ο Willett είναι συγγραφέας σε μια εργασία που εκπονήθηκε από τους ερευνητές του Στάνφορντ- η άλλη δημοσιεύθηκε από μια ομάδα του Πανεπιστημίου του Σαν Φρανσίσκο.
Παρόλο που είναι πιο αργή από τον ρυθμό των 160 λέξεων ανά λεπτό της φυσικής συνομιλίας μεταξύ των ομιλητών της αγγλικής γλώσσας, οι επιστήμονες λένε ότι είναι ένα συναρπαστικό βήμα προς την αποκατάσταση της ομιλίας σε πραγματικό χρόνο με τη χρήση μιας διεπαφής εγκεφάλου-υπολογιστή ή BCI. "Πλησιάζει στο να χρησιμοποιηθεί στην καθημερινή ζωή", λέει ο Marc Slutzky, νευρολόγος στο Πανεπιστήμιο Northwestern, ο οποίος δεν συμμετείχε στις νέες μελέτες.
Ένα BCI συλλέγει και αναλύει τα εγκεφαλικά σήματα και στη συνέχεια τα μεταφράζει σε εντολές που πρέπει να εκτελεστούν από μια εξωτερική συσκευή. Τέτοια συστήματα έχουν επιτρέψει σε παράλυτους ανθρώπους να ελέγχουν ρομποτικά χέρια, να παίζουν βιντεοπαιχνίδια και να στέλνουν μηνύματα ηλεκτρονικού ταχυδρομείου με το μυαλό τους. Προηγούμενες έρευνες των δύο ομάδων έδειξαν ότι ήταν δυνατή η μετάφραση της ομιλίας ενός παράλυτου ατόμου σε κείμενο στην οθόνη, αλλά με περιορισμένη ταχύτητα, ακρίβεια και λεξιλόγιο.
Στη μελέτη του Στάνφορντ, οι ερευνητές ανέπτυξαν ένα BCI που χρησιμοποιεί τη συστοιχία Utah, έναν μικροσκοπικό τετράγωνο αισθητήρα που μοιάζει με μια βούρτσα μαλλιών με 64 τρίχες που μοιάζουν με βελόνες. Κάθε μία έχει ένα ηλεκτρόδιο και μαζί συλλέγουν τη δραστηριότητα μεμονωμένων νευρώνων. Στη συνέχεια, οι ερευνητές εκπαίδευσαν ένα τεχνητό νευρωνικό δίκτυο για να αποκωδικοποιεί την εγκεφαλική δραστηριότητα και να τη μεταφράζει σε λέξεις που εμφανίζονται σε μια οθόνη.
Δοκίμασαν το σύστημα στον εθελοντή Pat Bennett, τον ασθενή με ALS, ο οποίος είναι σήμερα 68 ετών. Τον Μάρτιο του 2022, ένας χειρουργός εισήγαγε τέσσερις από αυτούς τους μικροσκοπικούς αισθητήρες στον εγκεφαλικό φλοιό του Bennett - το εξωτερικό στρώμα του εγκεφάλου. Λεπτά καλώδια συνδέουν τις συστοιχίες με βάθρα στην κορυφή του κεφαλιού της, τα οποία μπορούν να συνδεθούν με έναν υπολογιστή μέσω καλωδίων.
Κατά τη διάρκεια τεσσάρων μηνών, οι επιστήμονες εκπαίδευσαν το λογισμικό ζητώντας από την Μπένετ να προσπαθήσει να πει προτάσεις δυνατά. (Η Bennett μπορεί ακόμα να παράγει ήχους, αλλά η ομιλία της είναι ακατανόητη.) Τελικά, το λογισμικό έμαθε να αναγνωρίζει τα ξεχωριστά νευρικά σήματα που σχετίζονται με τις κινήσεις των χειλιών, του σαγονιού και της γλώσσας που έκανε για να παράγει διαφορετικούς ήχους. Από εκεί και πέρα, έμαθε τη νευρική δραστηριότητα που αντιστοιχεί στις κινήσεις που χρησιμοποιούνται για τη δημιουργία των ήχων που συνθέτουν τις λέξεις. Στη συνέχεια, ήταν σε θέση να προβλέψει ακολουθίες αυτών των λέξεων και να συνθέσει προτάσεις σε μια οθόνη υπολογιστή.
Με τη βοήθεια της συσκευής, ο Bennett μπόρεσε να επικοινωνήσει με μέσο ρυθμό 62 λέξεων ανά λεπτό. Το BCI έκανε λάθη σε ποσοστό 23,8 τοις εκατό του χρόνου σε ένα λεξιλόγιο 125.000 λέξεων. Το προηγούμενο ρεκόρ ήταν μόλις 18 λέξεις ανά λεπτό - ένα ρεκόρ που καθιερώθηκε το 2021, όταν τα μέλη της ομάδας του Στάνφορντ δημοσίευσαν μια εργασία που περιέγραφε ένα BCI που μετέτρεπε τον φανταστικό γραφικό χαρακτήρα ενός παράλυτου ατόμου σε κείμενο στην οθόνη.
Στη δεύτερη εργασία, ερευνητές του UCSF κατασκεύασαν ένα BCI χρησιμοποιώντας μια διάταξη που βρίσκεται στην επιφάνεια του εγκεφάλου και όχι μέσα σε αυτόν. Ένα ορθογώνιο, λεπτό σαν χαρτί, γεμάτο με 253 ηλεκτρόδια, ανιχνεύει τη δραστηριότητα πολλών νευρώνων σε ολόκληρο τον φλοιό της ομιλίας. Τοποθέτησαν αυτή τη συστοιχία στον εγκέφαλο μιας ασθενούς με εγκεφαλικό επεισόδιο που ονομαζόταν Ann και εκπαίδευσαν ένα μοντέλο βαθιάς μάθησης για να αποκρυπτογραφήσει τα νευρωνικά δεδομένα που συνέλεξε καθώς αυτή κινούσε τα χείλη της χωρίς να βγάζει ήχους. Σε διάστημα αρκετών εβδομάδων, η Ann επανέλαβε φράσεις από ένα λεξιλόγιο 1.024 λέξεων συνομιλίας.
Όπως και η τεχνητή νοημοσύνη του Στάνφορντ, ο αλγόριθμος της ομάδας του UCSF εκπαιδεύτηκε να αναγνωρίζει τις μικρότερες μονάδες της γλώσσας, που ονομάζονται φωνήματα, και όχι ολόκληρες λέξεις. Τελικά, το λογισμικό μπόρεσε να μεταφράσει την επιθυμητή ομιλία της Ann με ρυθμό 78 λέξεων ανά λεπτό - πολύ καλύτερο από τις 14 λέξεις ανά λεπτό που είχε συνηθίσει να χρησιμοποιεί στη συσκευή επικοινωνίας της με γραφομηχανή. Το ποσοστό λάθους του ήταν 4,9% όταν αποκωδικοποιούσε προτάσεις από ένα σύνολο 50 φράσεων και οι προσομοιώσεις υπολόγισαν ένα ποσοστό λάθους 28% χρησιμοποιώντας ένα λεξιλόγιο με περισσότερες από 39.000 λέξεις.
Η ομάδα του UCSF, με επικεφαλής τον νευροχειρουργό Έντουαρντ Τσανγκ, είχε προηγουμένως χρησιμοποιήσει μια παρόμοια επιφανειακή διάταξη με λιγότερα ηλεκτρόδια για να μεταφράσει την προβλεπόμενη ομιλία ενός παράλυτου άνδρα σε κείμενο σε μια οθόνη. Το ρεκόρ τους ήταν περίπου 15 λέξεις ανά λεπτό. Το σημερινό τους BCI δεν είναι μόνο ταχύτερο, αλλά πηγαίνει ένα βήμα παραπέρα μετατρέποντας τα εγκεφαλικά σήματα της Ανν σε ακουστική ομιλία που εκφωνείται από έναν υπολογιστή.
Οι ερευνητές δημιούργησαν ένα "ψηφιακό άβαταρ" για να αναμεταδίδει δυνατά την ομιλία της Ann. Προσάρμοσαν μια γυναίκα κινουμένων σχεδίων ώστε να έχει καστανά μαλλιά όπως της Ann και χρησιμοποίησαν βίντεο από το γάμο της για να κάνουν τη φωνή του avatar να ακούγεται όπως η δική της. "Η φωνή και οι εκφράσεις μας είναι μέρος της ταυτότητάς μας, οπότε θέλαμε να ενσωματώσουμε μια προσθετική ομιλία που θα μπορούσε να την κάνει πιο φυσική, ρευστή και εκφραστική", δήλωσε ο Τσανγκ κατά τη διάρκεια της ενημέρωσης των μέσων ενημέρωσης την Τρίτη. Πιστεύει ότι το έργο της ομάδας του θα μπορούσε τελικά να επιτρέψει στα άτομα με παράλυση να έχουν πιο εξατομικευμένες αλληλεπιδράσεις με την οικογένεια και τους φίλους τους.
Υπάρχουν συμβιβασμοί στις προσεγγίσεις και των δύο ομάδων. Τα εμφυτευμένα ηλεκτρόδια, όπως αυτά που χρησιμοποίησε η ομάδα του Στάνφορντ, καταγράφουν τη δραστηριότητα μεμονωμένων νευρώνων, η οποία τείνει να παρέχει πιο λεπτομερείς πληροφορίες από μια καταγραφή από την επιφάνεια του εγκεφάλου. Αλλά είναι επίσης λιγότερο σταθερά, επειδή τα εμφυτευμένα ηλεκτρόδια μετακινούνται στον εγκέφαλο. Ακόμη και μια κίνηση ενός ή δύο χιλιοστών προκαλεί αλλαγές στην καταγεγραμμένη δραστηριότητα. "Είναι δύσκολο να καταγράψουμε από τους ίδιους νευρώνες για εβδομάδες κάθε φορά, πόσο μάλλον για μήνες ή χρόνια κάθε φορά", λέει ο Slutzky. Και με την πάροδο του χρόνου, σχηματίζεται ουλώδης ιστός γύρω από το σημείο του εμφυτευμένου ηλεκτροδίου, ο οποίος μπορεί επίσης να επηρεάσει την ποιότητα της καταγραφής.
Από την άλλη πλευρά, μια επιφανειακή διάταξη καταγράφει λιγότερο λεπτομερή εγκεφαλική δραστηριότητα, αλλά καλύπτει μεγαλύτερη περιοχή. Τα σήματα που καταγράφει είναι πιο σταθερά από τις αιχμές μεμονωμένων νευρώνων, καθώς προέρχονται από χιλιάδες νευρώνες, λέει ο Slutzky.
Κατά τη διάρκεια της ενημέρωσης, ο Willett δήλωσε ότι η τρέχουσα τεχνολογία είναι περιορισμένη λόγω του αριθμού των ηλεκτροδίων που μπορούν να τοποθετηθούν με ασφάλεια στον εγκέφαλο ταυτόχρονα. "Όπως μια φωτογραφική μηχανή με περισσότερα εικονοστοιχεία δίνει μια πιο ευκρινή εικόνα, έτσι και η χρήση περισσότερων ηλεκτροδίων θα μας δώσει μια πιο καθαρή εικόνα για το τι συμβαίνει στον εγκέφαλο", είπε.
Ο Leigh Hochberg, νευρολόγος στο Γενικό Νοσοκομείο της Μασαχουσέτης και στο Πανεπιστήμιο Brown, ο οποίος συνεργάστηκε με την ομάδα του Στάνφορντ, λέει ότι πριν από 10 χρόνια λίγοι άνθρωποι θα μπορούσαν να φανταστούν ότι κάποια μέρα θα ήταν δυνατόν να αποκωδικοποιηθεί η επιχειρούμενη ομιλία ενός ατόμου απλώς και μόνο με την καταγραφή της εγκεφαλικής του δραστηριότητας. "Θέλω να μπορώ να λέω στους ασθενείς μου με ALS ή εγκεφαλικό επεισόδιο στο εγκεφαλικό στέλεχος ή άλλες μορφές νευρολογικής νόσου ή τραυματισμού ότι μπορούμε να αποκαταστήσουμε την ικανότητά τους να επικοινωνούν εύκολα, διαισθητικά και γρήγορα", λέει ο Hochberg.
Αν και εξακολουθούν να είναι πιο αργοί από την τυπική ομιλία, αυτά τα νέα BCI είναι ταχύτερα από τα υπάρχοντα συστήματα επαυξητικής και εναλλακτικής επικοινωνίας, γράφει ο Betts Peters, λογοθεραπευτής στο Πανεπιστήμιο Υγείας και Επιστημών του Όρεγκον. Αυτά τα συστήματα απαιτούν από τους χρήστες να πληκτρολογούν ή να επιλέγουν μηνύματα χρησιμοποιώντας τα δάχτυλά τους ή το βλέμμα τους. "Η δυνατότητα να συμβαδίζουν με τη ροή της συνομιλίας θα μπορούσε να αποτελέσει τεράστιο όφελος για πολλά άτομα με προβλήματα επικοινωνίας, διευκολύνοντας την πλήρη συμμετοχή τους σε όλες τις πτυχές της ζωής", δήλωσε στο WIRED μέσω ηλεκτρονικού ταχυδρομείου.
Υπάρχουν ακόμη ορισμένα τεχνολογικά εμπόδια για τη δημιουργία μιας εμφυτεύσιμης συσκευής με αυτές τις δυνατότητες. Πρώτον, ο Slutzky λέει ότι το ποσοστό σφάλματος και για τις δύο ομάδες είναι ακόμα αρκετά υψηλό για καθημερινή χρήση. Συγκριτικά, τα τρέχοντα συστήματα αναγνώρισης ομιλίας που έχουν αναπτυχθεί από τη Microsoft και τη Google έχουν ποσοστό σφάλματος περίπου 5 τοις εκατό.
Μια άλλη πρόκληση είναι η μακροβιότητα και η αξιοπιστία της συσκευής. Ένα πρακτικό BCI θα πρέπει να καταγράφει συνεχώς σήματα για χρόνια και να μην απαιτεί καθημερινή επαναβαθμονόμηση, λέει ο Slutzky.
Τα BCI θα πρέπει επίσης να είναι ασύρματα, χωρίς τα ογκώδη καλώδια που απαιτούνται από τα σημερινά συστήματα, ώστε να μπορούν να χρησιμοποιούνται χωρίς να χρειάζεται να είναι οι ασθενείς συνδεδεμένοι με έναν υπολογιστή. Εταιρείες όπως η Neuralink, η Synchron και η Paradromics εργάζονται σε ασύρματα συστήματα.
"Ήδη τα αποτελέσματα είναι απίστευτα", λέει ο Matt Angle, ιδρυτής και διευθύνων σύμβουλος της Paradromics με έδρα το Όστιν, ο οποίος δεν συμμετείχε στις νέες εργασίες. "Νομίζω ότι θα αρχίσουμε να βλέπουμε ταχεία πρόοδο προς μια ιατρική συσκευή για τους ασθενείς".
Πηγή: Brain Implants That Help Paralyzed People Speak Just Broke New Records
