27 Μαρτίου 2023

Το ρομπότ FRIDA με τεχνητή νοημοσύνη συνεργάζεται με τον άνθρωπο για να δημιουργήσει τέχνη

Περίληψη άρθρου:
Η FRIDA είναι ένας ρομποτικός βραχίονας με ένα πινέλο κολλημένο πάνω του, ο οποίος χρησιμοποιεί τεχνητή νοημοσύνη για να συνεργάζεται με τους ανθρώπους σε έργα τέχνης. Αποτελεί μέρος του Ινστιτούτου Ρομποτικής του Πανεπιστημίου Carnegie Mellon και διευθύνεται από τους Peter Schaldenbrand, Jean Oh και Jim McCann. Το FRIDA δέχεται δεδομένα από μια περιγραφή κειμένου, άλλα έργα τέχνης ή μια φωτογραφία και χρησιμοποιεί μοντέλα τεχνητής νοημοσύνης παρόμοια με το ChatGPT και το DALL-E 2 της OpenAI για να δημιουργήσει έναν πίνακα. Το ρομπότ χρησιμοποιεί επίσης μια ιδέα γνωστή ως real2sim2real για να μειώσει το χάσμα μεταξύ προσομοίωσης και πραγματικότητας. Η ομάδα εργάζεται επίσης σε συνεισφορές δεδομένων εκπαίδευσης από διάφορες χώρες για να αποφύγει μια αμερικανική ή δυτική προκατάληψη. Η FRIDA θα παρουσιάσει την έρευνά της στο Διεθνές Συνέδριο Ρομποτικής και Αυτοματισμού IEEE 2023 στο Λονδίνο.


Αναλυτικά το άρθρο:
Το Ινστιτούτο Ρομποτικής του Πανεπιστημίου Carnegie Mellon έχει έναν νέο καλλιτέχνη-μέλος, το FRIDA, έναν ρομποτικό βραχίονα με ένα πινέλο κολλημένο πάνω του. Το FRIDA χρησιμοποιεί τεχνητή νοημοσύνη για να συνεργάζεται με τον άνθρωπο σε έργα τέχνης. Το ρομπότ είναι ικανό να δημιουργεί τους δικούς του πίνακες ζωγραφικής με βάση τις εισροές των ανθρώπων.

Ο Peter Schaldenbrand, διδακτορικός φοιτητής στο Ινστιτούτο Ρομποτικής, ηγείται του έργου και διερευνά την τεχνητή νοημοσύνη και τη δημιουργικότητα. Το FRIDA σημαίνει Framework and Robotics Initiative for Developing Arts και έχει προσελκύσει φοιτητές και ερευνητές από όλο το CMU. Το έργο έχει ήδη δημιουργήσει έναν πίνακα μιας μπαλαρίνας βατράχου που ο Schaldenbrand βρίσκει πολύ επιτυχημένο.

Το FRIDA είναι ένα μοναδικό έργο που συνδυάζει τη ρομποτική, την τεχνητή νοημοσύνη και την τέχνη για να δημιουργήσει κάτι πραγματικά ξεχωριστό. Το FRIDA δεν είναι καλλιτέχνης, αλλά μάλλον ένα εργαλείο που χρησιμοποιούν οι καλλιτέχνες για να δημιουργήσουν τέχνη. Έχει σχεδιαστεί για να είναι ένα εργαλείο συνεργασίας με τους καλλιτέχνες, επιτρέποντάς τους να καθορίζουν στόχους υψηλού επιπέδου για την εκτέλεση από το ρομπότ.

Οι χρήστες μπορούν να κατευθύνουν το FRIDA εισάγοντας μια περιγραφή κειμένου, υποβάλλοντας άλλα έργα τέχνης για να εμπνευστεί το στυλ του ή ανεβάζοντας μια φωτογραφία και ζητώντας του να ζωγραφίσει μια αναπαράστασή της. Η ομάδα πειραματίζεται επίσης με άλλες εισόδους, όπως ο ήχος, και είχε επιτυχία με την αναπαραγωγή του "Dancing Queen" των ABBA και ζητώντας από το FRIDA να το ζωγραφίσει.

Το FRIDA είναι ένα ρομποτικό έργο που χρησιμοποιεί μοντέλα τεχνητής νοημοσύνης για να παράγει εικόνες ως απάντηση σε μια προτροπή. Προσομοιώνει τον τρόπο με τον οποίο θα ζωγράφιζε μια εικόνα με πινελιές και χρησιμοποιεί μηχανική μάθηση για να αξιολογεί την πρόοδό του καθώς εργάζεται. Τα τελικά αποτελέσματα είναι ιμπρεσιονιστικά και ιδιόρρυθμα, με έντονες πινελιές και τη δυνατότητα να ενσωματώνει λάθη στο τελικό προϊόν.

Το FRIDA διερευνά τη διασταύρωση της ανθρώπινης και της ρομποτικής δημιουργικότητας, χρησιμοποιώντας μοντέλα τεχνητής νοημοσύνης που έχουν αναπτυχθεί για να επιγράφουν εικόνες και να κατανοούν το περιεχόμενο σκηνών. Είναι ένα ρομπότ με τεχνητή νοημοσύνη που χρησιμοποιεί μηχανική μάθηση και τεχνητή νοημοσύνη για να δημιουργεί φυσικούς πίνακες ζωγραφικής.

Ξεκινάει μαθαίνοντας πώς να χρησιμοποιεί το πινέλο του και στη συνέχεια χρησιμοποιεί μεγάλα μοντέλα γλώσσας-όρασης για να κατανοήσει την είσοδο. Το FRIDA πηγαίνει τα εργαλεία δημιουργίας εικόνων, όπως το DALL-E 2 της OpenAI, ένα βήμα παραπέρα και χρησιμοποιεί το ενσωματωμένο ρομποτικό του σύστημα για να παράγει φυσικούς πίνακες ζωγραφικής.

Για να μειώσει το χάσμα μεταξύ προσομοίωσης και πραγματικότητας, το FRIDA χρησιμοποιεί μια ιδέα γνωστή ως real2sim2real, η οποία χρησιμοποιεί τις πραγματικές πινελιές του ρομπότ για να εκπαιδεύσει τον προσομοιωτή ώστε να αντικατοπτρίζει και να μιμείται τις φυσικές δυνατότητες του ρομπότ και των υλικών ζωγραφικής.

Η ομάδα του έργου FRIDA είναι μια ομάδα ερευνητών που εργάζεται για τη βελτίωση μεγάλων μοντέλων όρασης-γλώσσας. Με επικεφαλής τους Zhixuan Liu, Beverley-Claire Okogwu, Youeun Shin και Youngsik Yun, η ομάδα εργάζεται για τη μείωση της προκατάληψης στα μοντέλα εκπαιδεύοντάς τα σε τίτλους ειδήσεων και εικόνες από διαφορετικούς πολιτισμούς. Η ομάδα έχει λάβει συνεισφορές από την Κίνα, την Ιαπωνία, την Κορέα, το Μεξικό, τη Νιγηρία, τη Νορβηγία, το Βιετνάμ και άλλες χώρες.

Στόχος τους είναι να δημιουργήσουν μοντέλα που θα είναι πιο αντιπροσωπευτικά του κόσμου και λιγότερο προκατειλημμένα προς την αμερικανική ή τη δυτική κουλτούρα. Το FRIDA είναι ένα ρομπότ που χρησιμοποιεί μηχανική μάθηση για να δημιουργεί πίνακες ζωγραφικής. Ξεκινά λαμβάνοντας μια ιδέα υψηλού επιπέδου από τον άνθρωπο-χρήστη του και έπειτα εμφανίζει μια παλέτα χρωμάτων για να την αναμείξει. Στη συνέχεια, το ρομπότ χρησιμοποιεί μια κάμερα από πάνω για να καταγράφει εικόνες του πίνακα καθώς προχωράει, τις οποίες χρησιμοποιεί για να αξιολογεί την πρόοδό του και να βελτιώνει το σχέδιό του.

Η όλη διαδικασία διαρκεί ώρες για να ολοκληρωθεί. Επικεφαλής του έργου είναι ο Jiaying Wei, μεταπτυχιακός φοιτητής στη Σχολή Αρχιτεκτονικής, και ο Eunsu Kang, καθηγητής στο Τμήμα Μηχανικής Μάθησης. Το έργο FRIDA είναι μια ερευνητική πρωτοβουλία που επιδιώκει να προωθήσει την ανθρώπινη δημιουργικότητα μέσω της χρήσης της ρομποτικής. Επικεφαλής του έργου είναι ο Dr. Oh και η ομάδα του, οι οποίοι θα παρουσιάσουν την τελευταία τους έρευνα στο Διεθνές Συνέδριο Ρομποτικής και Αυτοματισμού IEEE 2023 στο Λονδίνο.

Το έργο φιλοξενείται στο εργαστήριο Bot Intelligence Group (BIG) στο Squirrel Hill του Πίτσμπουργκ. Στόχος του FRIDA είναι να υποστηρίξει και να ενισχύσει την ανθρώπινη δημιουργικότητα, όχι να την αντικαταστήσει. Ο Dr. Oh πιστεύει ότι το FRIDA μπορεί να χρησιμοποιηθεί για την έκφραση ιδεών στη ζωγραφική, ενώ περισσότερες πληροφορίες για το έργο μπορείτε να βρείτε στην ιστοσελίδα του.

Πηγή: AI-Powered FRIDA robot collaborates with humans to create art