Οι λέξεις αποδεικνύουν την αξία τους ως εργαλεία διδασκαλίας για ρομπότ

23/12/2022 | | |

Περίληψη Άρθρου:
Οι ερευνητές του Princeton ανέπτυξαν μια νέα μέθοδο, την ATLA, η οποία χρησιμοποιεί περιγραφές εργαλείων στην ανθρώπινη γλώσσα για να επιταχύνει την εκμάθηση ενός προσομοιωμένου ρομποτικού βραχίονα. Η μέθοδος αυτή βελτιώνει την ικανότητα του ρομπότ να χειρίζεται νεοεμφανιζόμενα εργαλεία που δεν περιλαμβάνονταν στο αρχικό σύνολο εκπαίδευσης. Η ομάδα χρησιμοποίησε το GPT-3, ένα μεγάλο γλωσσικό μοντέλο που κυκλοφόρησε από το OpenAI το 2020, για να παράγει κείμενο ως απάντηση σε μια προτροπή. Τα πειράματα εκμάθησης με προσομοίωση ρομπότ χρησιμοποίησαν ένα σύνολο εκπαίδευσης με 27 εργαλεία και τέσσερις διαφορετικές εργασίες. Τα αποτελέσματα έδειξαν ότι η παροχή γλωσσικών πληροφοριών κατά τη διάρκεια της εκπαίδευσης AI μπορεί να κάνει τα αυτόνομα ρομπότ πιο προσαρμοστικά σε νέες καταστάσεις. Η εργασία αυτή αποτελεί την πρώτη συνεργασία μεταξύ των ερευνητικών ομάδων του Narasimhan και του Majumdar και υποστηρίχθηκε από το Toyota Research Institute, το Εθνικό Ίδρυμα Επιστημών των ΗΠΑ, το Office of Naval Research και τη Σχολή Μηχανικής και Εφαρμοσμένων Επιστημών του Πανεπιστημίου Princeton.

Αναλυτικά το Άρθρο:
Ερευνώντας έναν νέο τρόπο διδασκαλίας των ρομπότ, ερευνητές του Princeton διαπίστωσαν ότι οι περιγραφές εργαλείων στην ανθρώπινη γλώσσα μπορούν να επιταχύνουν την εκμάθηση ενός προσομοιωμένου ρομποτικού βραχίονα που σηκώνει και χρησιμοποιεί μια ποικιλία εργαλείων.

Τα αποτελέσματα βασίζονται σε στοιχεία που αποδεικνύουν ότι η παροχή πλουσιότερων πληροφοριών κατά την εκπαίδευση της τεχνητής νοημοσύνης (AI) μπορεί να κάνει τα αυτόνομα ρομπότ πιο προσαρμοστικά σε νέες καταστάσεις, βελτιώνοντας την ασφάλεια και την αποτελεσματικότητά τους.

Η προσθήκη περιγραφών της μορφής και της λειτουργίας ενός εργαλείου στη διαδικασία εκπαίδευσης του ρομπότ βελτίωσε την ικανότητα του ρομπότ να χειρίζεται νέα εργαλεία που δεν περιλαμβάνονταν στο αρχικό σύνολο εκπαίδευσης.

Μια ομάδα μηχανολόγων μηχανικών και επιστημόνων πληροφορικής παρουσίασε τη νέα μέθοδο, Accelerated Learning of Tool Manipulation with LAnguage ή ATLA, στο συνέδριο για τη μάθηση ρομπότ στις 14 Δεκεμβρίου.

Οι ρομποτικοί βραχίονες έχουν μεγάλες δυνατότητες να βοηθήσουν σε επαναλαμβανόμενες ή δύσκολες εργασίες, αλλά η εκπαίδευση των ρομπότ για τον αποτελεσματικό χειρισμό εργαλείων είναι δύσκολη: τα εργαλεία έχουν μεγάλη ποικιλία σχημάτων και η επιδεξιότητα και η όραση ενός ρομπότ δεν μπορούν να συγκριθούν με αυτές ενός ανθρώπου.

«Οι πρόσθετες πληροφορίες με τη μορφή γλώσσας μπορούν να βοηθήσουν ένα ρομπότ να μάθει να χρησιμοποιεί τα εργαλεία πιο γρήγορα», δήλωσε ο συν-συγγραφέας της μελέτης Anirudha Majumdar, επίκουρος καθηγητής μηχανολογίας και αεροδιαστημικής μηχανικής στο Princeton που διευθύνει το Intelligent Robot Motion Lab.

Η ομάδα έλαβε περιγραφές εργαλείων με ερωτήματα στο GPT-3, ένα μεγάλο γλωσσικό μοντέλο που κυκλοφόρησε από το OpenAI το 2020 και χρησιμοποιεί μια μορφή τεχνητής νοημοσύνης που ονομάζεται βαθιά μάθηση για να παράγει κείμενο ως απάντηση σε μια προτροπή.

Αφού πειραματίστηκαν με διάφορες προτροπές, κατέληξαν στη χρήση «Περιγράψτε το [χαρακτηριστικό] του [εργαλείου] σε μια λεπτομερή και επιστημονική απάντηση», όπου το χαρακτηριστικό ήταν το σχήμα ή ο σκοπός του εργαλείου.

«Επειδή αυτά τα γλωσσικά μοντέλα έχουν εκπαιδευτεί στο διαδίκτυο, κατά μία έννοια μπορείτε να το θεωρήσετε ως έναν διαφορετικό τρόπο ανάκτησης αυτών των πληροφοριών», πιο αποτελεσματικά και περιεκτικά από τη χρήση crowdsourcing ή την απόξεση συγκεκριμένων ιστότοπων για περιγραφές εργαλείων, δήλωσε ο Karthik Narasimhan, επίκουρος καθηγητής πληροφορικής και συν-συγγραφέας της μελέτης.

Ο Narasimhan είναι επικεφαλής της ομάδας επεξεργασίας φυσικής γλώσσας (NLP) του Princeton και συνέβαλε στο αρχικό γλωσσικό μοντέλο GPT ως επισκέπτης ερευνητής στο OpenAI.

Η εργασία αυτή είναι η πρώτη συνεργασία μεταξύ των ερευνητικών ομάδων του Narasimhan και του Majumdar. Ο Majumdar επικεντρώνεται στην ανάπτυξη πολιτικών βασισμένων στην τεχνητή νοημοσύνη που βοηθούν τα ρομπότ - συμπεριλαμβανομένων των ιπτάμενων και περπατητών ρομπότ - να γενικεύουν τις λειτουργίες τους σε νέα περιβάλλοντα, και ήταν περίεργος για τις δυνατότητες της πρόσφατης «τεράστιας προόδου στην επεξεργασία φυσικής γλώσσας» να ωφελήσει τη μάθηση των ρομπότ, όπως είπε.

Για τα πειράματα προσομοίωσης εκμάθησης ρομπότ, η ομάδα επέλεξε ένα σύνολο εκπαίδευσης 27 εργαλείων, που κυμαίνονταν από ένα τσεκούρι μέχρι ένα σκουπάκι. Έδωσαν στον ρομποτικό βραχίονα τέσσερις διαφορετικές εργασίες: να σπρώξει το εργαλείο, να σηκώσει το εργαλείο, να το χρησιμοποιήσει για να σαρώσει έναν κύλινδρο κατά μήκος ενός τραπεζιού ή να σφυρηλατήσει ένα μανταλάκι σε μια τρύπα.

Οι ερευνητές ανέπτυξαν μια σειρά από πολιτικές χρησιμοποιώντας προσεγγίσεις εκπαίδευσης μηχανικής μάθησης με και χωρίς γλωσσικές πληροφορίες και στη συνέχεια συνέκριναν την απόδοση των πολιτικών σε ένα ξεχωριστό σύνολο δοκιμών με εννέα εργαλεία με ζευγαρωτές περιγραφές.

Η προσέγγιση αυτή είναι γνωστή ως μετα-μάθηση, καθώς το ρομπότ βελτιώνει την ικανότητά του να μαθαίνει με κάθε διαδοχική εργασία.

Δεν μαθαίνει μόνο να χρησιμοποιεί το κάθε εργαλείο, αλλά και "προσπαθεί να μάθει να κατανοεί τις περιγραφές του καθενός από αυτά τα εκατό διαφορετικά εργαλεία, έτσι ώστε όταν δει το 101ο εργαλείο να μαθαίνει πιο γρήγορα να χρησιμοποιεί το νέο εργαλείο", δήλωσε ο Narasimhan.«Κάνουμε δύο πράγματα: Μαθαίνουμε στο ρομπότ πώς να χρησιμοποιεί τα εργαλεία, αλλά του μαθαίνουμε και αγγλικά».

Οι ερευνητές μέτρησαν την επιτυχία του ρομπότ στο σπρώξιμο, το σήκωμα, το σκούπισμα και το σφυροκόπημα με τα εννέα εργαλεία δοκιμής, συγκρίνοντας τα αποτελέσματα που επιτεύχθηκαν με τις πολιτικές που χρησιμοποίησαν τη γλώσσα στη διαδικασία μηχανικής μάθησης με εκείνες που δεν χρησιμοποίησαν γλωσσικές πληροφορίες.

Στις περισσότερες περιπτώσεις, οι γλωσσικές πληροφορίες προσέφεραν σημαντικά πλεονεκτήματα για την ικανότητα του ρομπότ να χρησιμοποιεί νέα εργαλεία.

Μια εργασία που έδειξε αξιοσημείωτες διαφορές μεταξύ των πολιτικών ήταν η χρήση ενός λοστό για να σαρώσει έναν κύλινδρο ή μπουκάλι κατά μήκος ενός τραπεζιού, δήλωσε ο Allen Z. Ren, διδακτορικός φοιτητής στην ομάδα του Majumdar και κύριος συγγραφέας της ερευνητικής εργασίας.

«Με τη γλωσσική εκπαίδευση, μαθαίνει να πιάνει το μακρύ άκρο του λοστό και να χρησιμοποιεί την καμπύλη επιφάνεια για να περιορίζει καλύτερα την κίνηση του μπουκαλιού», δήλωσε ο Ren. «Χωρίς τη γλώσσα, έπιανε τον λοστό κοντά στην καμπύλη επιφάνεια και ήταν πιο δύσκολο να τον ελέγξει».

Η έρευνα υποστηρίχθηκε εν μέρει από το Ερευνητικό Ινστιτούτο της Toyota (TRI) και αποτελεί μέρος ενός ευρύτερου προγράμματος που χρηματοδοτείται από το TRI στην ερευνητική ομάδα του Majumdar και αποσκοπεί στη βελτίωση της ικανότητας των ρομπότ να λειτουργούν σε νέες καταστάσεις που διαφέρουν από τα περιβάλλοντα εκπαίδευσής τους.

«Ο γενικός στόχος είναι να αποκτήσουν τα ρομποτικά συστήματα - συγκεκριμένα, αυτά που εκπαιδεύονται με τη χρήση μηχανικής μάθησης - να γενικεύονται σε νέα περιβάλλοντα», δήλωσε ο Majumdar.

Άλλες εργασίες που υποστηρίζονται από το TRI από την ομάδα του έχουν ασχοληθεί με την πρόβλεψη αποτυχίας για τον έλεγχο ρομπότ με βάση την όραση και έχουν χρησιμοποιήσει μια προσέγγιση «δημιουργίας αντίπαλου περιβάλλοντος» για να βοηθήσουν τις πολιτικές των ρομπότ να λειτουργούν καλύτερα σε συνθήκες εκτός της αρχικής τους εκπαίδευσης.

Το άρθρο με τίτλο Leveraging language for accelerated learning of tool manipulation (Αξιοποίηση της γλώσσας για την ταχύτερη εκμάθηση του χειρισμού εργαλείων) παρουσιάστηκε στις 14 Δεκεμβρίου στο Conference on Robot Learning.

Εκτός από τους Majumdar, Narasimhan και Ren, οι συν-συγγραφείς περιλαμβάνουν τον Bharat Govil, τάξη του 2022 στο Princeton, και τον Tsung-Yen Yang, ο οποίος ολοκλήρωσε φέτος το διδακτορικό του στην ηλεκτρολογία στο Princeton και τώρα είναι επιστήμονας μηχανικής μάθησης στην Meta Platforms Inc.

Εκτός από το TRI, η έρευνα υποστηρίχθηκε από το Εθνικό Ίδρυμα Επιστημών των ΗΠΑ, το Γραφείο Ναυτικών Ερευνών και τη Σχολή Μηχανικής και Εφαρμοσμένων Επιστημών του Πανεπιστημίου Princeton μέσω της γενναιοδωρίας του William Addy '82.

Πηγή:https://www.sciencedaily.com/releases/2022/12/221222101033.htm

Οι λέξεις αποδεικνύουν την αξία τους ως εργαλεία διδασκαλίας για ρομπότ

Newsletter