6 Νοεμβρίου 2024

Ένας « επιστήμονας τεχνητής νοημοσύνης » εφευρίσκει και εκτελεί τα δικά του πειράματα

Περίληψη του άρθρου:

Πρόσφατες έρευνες στο Πανεπιστήμιο της Βρετανικής Κολομβίας παρουσιάζουν τη δυνατότητα της τεχνητής νοημοσύνης να καινοτομούν ανεξάρτητα, παρά τους τρέχοντες περιορισμούς. Με επικεφαλής τον Jeff Clune, διερευνoύνται συστήματα ανοικτής μάθησης που μπορούν να ενισχύσουν τις δυνατότητες της τεχνητής νοημοσύνης, αλλά οι ανησυχίες για την αξιοπιστία και την ασφάλεια παραμένουν.



Κύρια σημεία του άρθρου:

  • Πρόσφατες έρευνες στο Πανεπιστήμιο της Βρετανικής Κολομβίας (UBC) στο Βανκούβερ επικεντρώνεται στην τεχνητή νοημοσύνη
  • Το έργο στοχεύει να επιτρέψει στην τεχνητή νοημοσύνη να μάθει μέσω της επανάληψης και της εξερεύνησης νέων ιδεών και όχι μόνο της κατανάλωσης δεδομένων που δημιουργούνται από τον άνθρωπο.
  • Η έρευνα περιλαμβάνει βελτιώσεις στη δημιουργία τεχνικής εικόνας και επιτάχυνση της μάθησης σε βαθιά νευρωνικά δίκτυα.
  • Ο Jeff Clune, που ηγείται στο εργαστήριο UBC, αναγνωρίζει ότι ενώ αυτές οι ιδέες δεν είναι ακόμα επαναστατικές, αντιπροσωπεύουν υποσχόμενες δυνατότητες εξερεύνησης.
  • Τα τρέχοντα συστήματα τεχνητής νοημοσύνης περιορίζονται από την εξάρτησή τους από την προϋπάρχουσα ανθρώπινη γνώση. Η ανοιχτή μάθηση θα μπορούσε να ξεκλειδώσει νέες ευκαιρίες πέρα ​​από τις ανθρώπινες εισροές.
  • Οι μελλοντικές προσπάθειες θα επικεντρωθούν στη διασφάλιση των παραγόντων που παράγονται από την τεχνητή νοημοσύνη


Αναλυτικά το άρθρο:

Με μια πρώτη ματιά, μια πρόσφατη δέσμη ερευνητικών εργασιών που εκπονήθηκαν από ένα εξέχον εργαστήριο τεχνητής νοημοσύνης στο Πανεπιστήμιο της Βρετανικής Κολομβίας στο Βανκούβερ μπορεί να μη φαίνεται τόσο αξιοσημείωτη. Με σταδιακές βελτιώσεις σε υπάρχοντες αλγορίθμους και ιδέες, μοιάζουν με τα περιεχόμενα ενός μέτριου συνεδρίου ή περιοδικού για την τεχνητή νοημοσύνη. Όμως η έρευνα είναι, στην πραγματικότητα, αξιοσημείωτη. Και αυτό γιατί είναι εξ ολοκλήρου έργο ενός «επιστήμονα τεχνητής νοημοσύνης» που αναπτύχθηκε στο εργαστήριο του UBC μαζί με ερευνητές από το Πανεπιστήμιο της Οξφόρδης και μια νεοφυή επιχείρηση με την ονομασία Sakana AI.

Το έργο καταδεικνύει ένα πρώιμο βήμα προς κάτι που μπορεί να αποδειχθεί επαναστατικό τέχνασμα: να αφήνεται η τεχνητή νοημοσύνη να μαθαίνει εφευρίσκοντας και εξερευνώντας νέες ιδέες. Απλά δεν είναι εξαιρετικά καινοτόμες προς το παρόν. Αρκετές εργασίες περιγράφουν βελτιώσεις για τη βελτίωση μιας τεχνικής δημιουργίας εικόνων, γνωστής ως μοντελοποίηση διάχυσης- μια άλλη περιγράφει μια προσέγγιση για την επιτάχυνση της μάθησης στα βαθιά νευρωνικά δίκτυα.

«Δεν πρόκειται για επαναστατικές ιδέες. Δεν είναι εξαιρετικά δημιουργικές», παραδέχεται ο Jeff Clune, ο καθηγητής που ηγείται του εργαστηρίου UBC. «Αλλά φαίνονται πολύ ωραίες ιδέες που κάποιος μπορεί να δοκιμάσει».

Όσο καταπληκτικά και αν είναι τα σημερινά προγράμματα τεχνητής νοημοσύνης, περιορίζονται από την ανάγκη τους να καταναλώνουν δεδομένα εκπαίδευσης που δημιουργούνται από τον άνθρωπο. Αν τα προγράμματα τεχνητής νοημοσύνης μπορούν αντ' αυτού να μαθαίνουν με ανοιχτό τρόπο, πειραματιζόμενα και εξερευνώντας «ενδιαφέρουσες» ιδέες, ίσως ξεκλειδώσουν δυνατότητες που ξεπερνούν οτιδήποτε τους έχουν δείξει οι άνθρωποι.

Το εργαστήριο του Clune είχε αναπτύξει στο παρελθόν προγράμματα τεχνητής νοημοσύνης σχεδιασμένα να μαθαίνουν με αυτόν τον τρόπο. Για παράδειγμα, ένα πρόγραμμα με την ονομασία Omni προσπάθησε να δημιουργήσει τη συμπεριφορά εικονικών χαρακτήρων σε διάφορα περιβάλλοντα που έμοιαζαν με βιντεοπαιχνίδια, αρχειοθετώντας αυτά που φαίνονταν ενδιαφέροντα και στη συνέχεια επαναλαμβάνοντας τα με νέα σχέδια. Αυτά τα προγράμματα απαιτούσαν προηγουμένως χειροκίνητα κωδικοποιημένες οδηγίες προκειμένου να καθορίσουν το ενδιαφέρον. Τα μεγάλα γλωσσικά μοντέλα, ωστόσο, παρέχουν έναν τρόπο να αφήνουν αυτά τα προγράμματα να εντοπίζουν τι είναι πιο ενδιαφέρον, λόγω της ικανότητάς τους να μιμούνται την ανθρώπινη συλλογιστική. Ένα άλλο πρόσφατο έργο από το εργαστήριο του Clune χρησιμοποίησε αυτή την προσέγγιση για να αφήσει τα προγράμματα τεχνητής νοημοσύνης να ονειρευτούν τον κώδικα που επιτρέπει στους εικονικούς χαρακτήρες να κάνουν κάθε είδους πράγματα μέσα σε έναν κόσμο που μοιάζει με το Roblox.

Ο επιστήμονας της τεχνητής νοημοσύνης είναι ένα παράδειγμα του εργαστηρίου του Clune που ασχολείται με τις δυνατότητες. Το πρόγραμμα σκέφτεται πειράματα μηχανικής μάθησης, αποφασίζει τι φαίνεται πιο ελπιδοφόρο με τη βοήθεια ενός LLM, στη συνέχεια γράφει και εκτελεί τον απαραίτητο κώδικα - "ξέπλυμα και επανάληψη". Παρά τα απογοητευτικά αποτελέσματα, ο Clune λέει ότι τα προγράμματα ανοικτής μάθησης, όπως και τα ίδια τα γλωσσικά μοντέλα, θα μπορούσαν να γίνουν πολύ πιο ικανά καθώς η ισχύς των υπολογιστών που τα τροφοδοτούν αυξάνεται.

«Είναι σαν να εξερευνάς μια νέα ήπειρο ή έναν νέο πλανήτη», λέει ο Clune για τις δυνατότητες που ξεκλειδώνουν τα LLM. «Δεν ξέρουμε τι πρόκειται να ανακαλύψουμε, αλλά όπου κι αν γυρίσουμε, υπάρχει κάτι καινούργιο».

Ο Τομ Χόουπ, επίκουρος καθηγητής στο Εβραϊκό Πανεπιστήμιο της Ιερουσαλήμ και ερευνητής στο Ινστιτούτο Allen για την Τεχνητή Νοημοσύνη (AI2), λέει ότι ο επιστήμονας της Τεχνητής Νοημοσύνης, όπως και τα LLMs, φαίνεται να είναι εξαιρετικά παράγωγα και δεν μπορεί να θεωρηθεί αξιόπιστος. «Κανένα από τα συστατικά δεν είναι αξιόπιστο αυτή τη στιγμή», λέει.

Ο Χόουπ επισημαίνει ότι οι προσπάθειες για την αυτοματοποίηση στοιχείων της επιστημονικής ανακάλυψης εκτείνονται δεκαετίες πίσω στο έργο των πρωτοπόρων της τεχνητής νοημοσύνης Άλεν Νιούελ και Χέρμπερτ Σάιμον στη δεκαετία του 1970 και, αργότερα, στο έργο του Πατ

Langley στο Institute for the Study of Learning and Expertise. Σημειώνει επίσης ότι αρκετές άλλες ερευνητικές ομάδες, συμπεριλαμβανομένης μιας ομάδας στο AI2, έχουν αξιοποιήσει πρόσφατα LLMs για να βοηθήσουν στη δημιουργία υποθέσεων, στη συγγραφή εγγράφων και στην αξιολόγηση της έρευνας. «Έπιασαν το πνεύμα της εποχής», λέει ο Χόουπ για την ομάδα του UBC. «Η κατεύθυνση είναι, φυσικά, απίστευτα πολύτιμη, δυνητικά».

Το κατά πόσον τα συστήματα που βασίζονται σε LLM μπορούν ποτέ να καταλήξουν σε πραγματικά καινοτόμες ή επαναστατικές ιδέες παραμένει επίσης ασαφές. «Αυτό είναι το ερώτημα του τρισεκατομμυρίου δολαρίων», λέει ο Clune.

Ακόμα και χωρίς επιστημονικές ανακαλύψεις, η μάθηση με ανοιχτό περιεχόμενο μπορεί να είναι ζωτικής σημασίας για την ανάπτυξη πιο ικανών και χρήσιμων συστημάτων τεχνητής νοημοσύνης εδώ και τώρα. Μια έκθεση που δημοσιεύτηκε αυτό το μήνα από την Air Street Capital, μια επενδυτική εταιρεία, τονίζει τις δυνατότητες του έργου του Clune να αναπτύξει πιο ισχυρούς και αξιόπιστους πράκτορες τεχνητής νοημοσύνης, ή προγράμματα που εκτελούν αυτόνομα χρήσιμες εργασίες σε υπολογιστές. Όλες οι μεγάλες εταιρείες τεχνητής νοημοσύνης φαίνεται να βλέπουν τους πράκτορες ως το επόμενο μεγάλο πράγμα.

Αυτή την εβδομάδα, το εργαστήριο του Clune αποκάλυψε το τελευταίο του έργο μάθησης ανοικτού τύπου: ένα πρόγραμμα τεχνητής νοημοσύνης που εφευρίσκει και κατασκευάζει πράκτορες τεχνητής νοημοσύνης. Οι πράκτορες που σχεδιάζονται από την τεχνητή νοημοσύνη ξεπερνούν τους πράκτορες που σχεδιάζονται από τον άνθρωπο σε ορισμένες εργασίες, όπως τα μαθηματικά και η κατανόηση της ανάγνωσης. Το επόμενο βήμα θα είναι η επινόηση τρόπων για να αποτραπεί ένα τέτοιο σύστημα από το να παράγει πράκτορες που συμπεριφέρονται άσχημα. «Είναι δυνητικά επικίνδυνο», λέει ο Clune για την εργασία αυτή. «Πρέπει να το πετύχουμε σωστά, αλλά νομίζω ότι είναι εφικτό».

Πηγή : An ‘AI Scientist’ Is Inventing and Running Its Own Experiments