Η Google εκπαιδεύει ρομπότ με τον τρόπο που εκπαιδεύει τα chatbots AI

Περίληψη άρθρου:
Η Google κυκλοφόρησε το νέο μοντέλο εκμάθησης τεχνητής νοημοσύνης, το Robotic Transformer (RT-2), για να κάνει τα ρομπότ της πιο έξυπνα, διδάσκοντάς τα να αναγνωρίζουν οπτικά και γλωσσικά μοτίβα, να ερμηνεύουν οδηγίες και να συμπεραίνουν τις κατάλληλες ενέργειες. Το μοντέλο δοκιμάστηκε με επιτυχία με έναν ρομποτικό βραχίονα σε διάφορα σενάρια. Κατανοεί πολλαπλές γλώσσες και συνδυάζει δεδομένα από το διαδίκτυο και τη ρομποτική για την εκπαίδευση. Παρόλο που το ρομπότ έχει ακόμη κάποιες ατέλειες, η Google στοχεύει να βελτιώσει τις δυνατότητές του στο μέλλον.
Κύρια σημεία του άρθρου:
- Η Google κυκλοφόρησε το μοντέλο εκμάθησης τεχνητής νοημοσύνης Robotic Transformer (RT-2) για να κάνει τα ρομπότ της πιο έξυπνα.
- Το RT-2 είναι μια έκδοση του μοντέλου όρασης-γλώσσας-δράσης (VLA), το οποίο μαθαίνει στα ρομπότ να αναγνωρίζουν οπτικά και γλωσσικά μοτίβα για να ερμηνεύουν οδηγίες.
- Το μοντέλο δοκιμάστηκε με έναν ρομποτικό βραχίονα σε περιβάλλον γραφείου κουζίνας, αναγνωρίζοντας με επιτυχία αντικείμενα και ακολουθώντας οδηγίες.
- Η πρώτη προσπάθεια της Google για πιο έξυπνα ρομπότ ήταν το σύστημα PaLM-SayCan, που ενσωμάτωσε το LLM PaLM με τη φυσική ρομποτική.
Αναλυτικά το άρθρο:
Η Google θέλει να κάνει τα ρομπότ της πιο έξυπνα με την κυκλοφορία του μοντέλου εκμάθησης τεχνητής νοημοσύνης Robotic Transformer (RT-2).
Το RT-2 είναι η νέα έκδοση αυτού που η εταιρεία αποκαλεί μοντέλο όρασης-γλώσσας-δράσης (VLA). Το μοντέλο μαθαίνει στα ρομπότ να αναγνωρίζουν καλύτερα οπτικά και γλωσσικά μοτίβα για να ερμηνεύουν οδηγίες και να συμπεραίνουν ποια αντικείμενα λειτουργούν καλύτερα για το αίτημα.
Οι ερευνητές δοκίμασαν το RT-2 με έναν ρομποτικό βραχίονα σε περιβάλλον γραφείου κουζίνας, ζητώντας από τον ρομποτικό βραχίονα του να αποφασίσει τι είναι ένα καλό αυτοσχέδιο σφυρί (ήταν μια πέτρα) και να επιλέξει ένα ποτό για να δώσει σε ένα εξαντλημένο άτομο (ένα Red Bull). Είπαν επίσης στο ρομπότ να μετακινήσει ένα κουτάκι κόκα κόλα σε μια φωτογραφία της Taylor Swift. Το ρομπότ είναι Swiftie, και αυτό είναι καλό νέο για την ανθρωπότητα.
Το νέο μοντέλο εκπαιδεύτηκε σε δεδομένα του διαδικτύου και της ρομποτικής, αξιοποιώντας τις ερευνητικές προόδους σε μεγάλα γλωσσικά μοντέλα όπως το Bard της Google και συνδυάζοντάς τα με ρομποτικά δεδομένα (όπως ποιες αρθρώσεις πρέπει να κινηθούν), αναφέρει η εταιρεία σε ένα έγγραφο. Κατανοεί επίσης οδηγίες σε άλλες γλώσσες εκτός των αγγλικών.
Εδώ και χρόνια, οι ερευνητές προσπαθούν να προσδώσουν στα ρομπότ καλύτερη συμπερασματολογία για να βρουν τον τρόπο ύπαρξής τους σε ένα πραγματικό περιβάλλον. Ο James Vincent του Verge επεσήμανε ότι η πραγματική ζωή είναι ασυμβίβαστα ακατάστατη. Τα ρομπότ χρειάζονται περισσότερες οδηγίες μόνο και μόνο για να κάνουν κάτι απλό για τους ανθρώπους. Για παράδειγμα, το καθάρισμα ενός χυμένου ποτού. Οι άνθρωποι ενστικτωδώς ξέρουν τι πρέπει να κάνουν: να σηκώσουν το ποτήρι, να πάρουν κάτι για να απορροφήσουν το χάος, να το πετάξουν και να είναι προσεκτικοί την επόμενη φορά.
Παλαιότερα, η διδασκαλία ενός ρομπότ απαιτούσε πολύ χρόνο. Οι ερευνητές έπρεπε να προγραμματίσουν ξεχωριστά τις οδηγίες. Αλλά με τη δύναμη των μοντέλων VLA όπως το RT-2, τα ρομπότ μπορούν να έχουν πρόσβαση σε ένα μεγαλύτερο σύνολο πληροφοριών για να συμπεράνουν τι πρέπει να κάνουν στη συνέχεια.
Η πρώτη εξόρμηση της Google σε πιο έξυπνα ρομπότ ξεκίνησε πέρυσι, όταν ανακοίνωσε ότι θα χρησιμοποιήσει το LLM PaLM στη ρομποτική, δημιουργώντας το σύστημα με το αμήχανο όνομα PaLM-SayCan για να ενσωματώσει το LLM με τη φυσική ρομποτική.
Το νέο ρομπότ της Google δεν είναι τέλειο. Οι New York Times πρόλαβαν να δουν μια ζωντανή επίδειξη του ρομπότ και ανέφεραν ότι αναγνώρισε λανθασμένα τις γεύσεις των αναψυκτικών και αναγνώρισε λανθασμένα τα φρούτα ως λευκό χρώμα.
Ανάλογα με το είδος του ανθρώπου που είστε, αυτή η είδηση είτε είναι ευπρόσδεκτη είτε σας θυμίζει τα τρομακτικά σκυλιά-ρομπότ από το Black Mirror (επηρεασμένα από τα ρομπότ της Boston Dynamics). Όπως και να έχει, θα πρέπει να περιμένουμε ένα ακόμα πιο έξυπνο ρομπότ το επόμενο έτος. Μπορεί ακόμη και να καθαρίσει μια διαρροή με ελάχιστες οδηγίες.
Πηγή: Google is training robots the way it trains AI chatbots
