Πόσα πάρκα υπάρχουν κοντά στο νέο σπίτι που σκέφτεσαι να αγοράσεις; Ποιος είναι ο καλύτερος συνδυασμός κρασιού για ένα γεύμα σε ένα εστιατόριο; Αυτές οι καθημερινές απορίες απαιτούν λογική σκέψη, σημαντικό στοιχείο ανώτερης σκέψης που μέχρι τώρα ήταν δύσκολο να χειριστεί η τεχνητή νοημοσύνη (ΑΙ). Πλέον, οι ερευνητές του DeepMind της Google έχουν αναπτύξει έναν απλό αλγόριθμο που χειρίζεται τέτοιες λογικές σκέψεις- και έχει ήδη νικήσει τους ανθρώπους σε πολύπλοκα τεστ κατανόησης εικόνων.

 Οι άνθρωποι είναι γενικά πολύ καλοί στη λογική σκέψη, ένα είδος σκέψης που χρησιμοποιεί τη λογική για να συνδέσει και να συγκρίνει μέρη, αλληλουχίες, και άλλες οντότητες. Αλλά τα δύο είδη τεχνητής νοημοσύνης- η στατιστική και η συμβολική-  δεν μπόρεσαν να αναπτύξουν σύντομα παρόμοιες ικανότητες. Η στατιστική νοημοσύνη, ή μηχανική εκμάθηση, είναι αποτελεσματική στην αναγνώριση μοτίβων, αλλά όχι στη χρήση της λογικής. Και η συμβολική νοημοσύνη μπορεί να επεξεργαστεί λογικά όσον αφορά τις σχέσεις, χρησιμοποιώντας προκαθορισμένους κανόνες, αλλά δεν είναι αποτελεσματική στην γρήγορη εκμάθηση.

Η νέα έρευνα προτείνει έναν τρόπο γεφύρωσης του χάσματος: το τεχνητό νευρωνικό δίκτυο για τη σχεσιακή λογική σκέψη. Παρόμοια με τον τρόπο με τον οποίο οι νευρώνες συνδέονται με τον εγκέφαλο, τα νευρικά δίκτυα συνδέονται μεταξύ τους σε μικρά προγράμματα που μπορούν συνεργατικά να εντοπίσουν μοτίβα σε δεδομένα. Μπορούν να περιλαμβάνουν ειδικές δομές για την επεξεργασία εικόνων, να αναλύουν γλώσσες, ή ακόμα και να μαθαίνουν παιχνίδια. Σε αυτή την περίπτωση, το νέο «σχεσιακό δίκτυο» συνδέεται ώστε να συγκρίνει κάθε ζεύγος αντικειμένων σε ένα ατομικό σενάριο. «Ρυθμίζουμε το δίκτυο ώστε να ανακαλύψει τις σχέσεις που υπάρχουν ανάμεσα σε αντικείμενα», υποστηρίζει ο Timothy Lillicrap,  ένας επιστήμονας υπολογιστών στο Λονδίνο, ο οποίος συμμετείχε στη συγγραφή του άρθρου.

Ο ίδιος και η ομάδα του δημιούργησαν προκλήσεις στο σχεσιακό τους δίκτυο μέσα από διάφορες δραστηριότητες. Η πρώτη ήταν να απαντήσει σε ερωτήσεις που αφορούν τις σχέσεις μεταξύ αντικειμένων σε μια εικόνα, όπως κύβους, μπάλες και κυλίνδρους. Για παράδειγμα: «Υπάρχει ένα αντικείμενο μπροστά από ένα μπλε αντικείμενο. Έχει το ίδιο σχήμα με το μικρό κυανό αντικείμενο που είναι δεξιά από την γκρι μεταλλική μπάλα;» Για τη δραστηριότητα αυτή, το σχεσιακό δίκτυο συνδυάστηκε με δύο άλλα είδη νευρικών δικτύων: ένα για την αναγνώριση αντικειμένων σε μία εικόνα, και ένα για την ερμηνεία της ερώτησης. Σε πολλές εικόνες και ερωτήσεις, άλλοι αλγόριθμοι μηχανικής εκμάθησης ήταν σωστοί σε ποσοστό 42% έως 77%. Οι άνθρωποι έφτασαν αντίστοιχα το 92%. Ο νέος συνδυασμός σχεσιακού δικτύου ήταν σωστός σε ποσοστό 96%, ποσοστό πάνω από τις ικανότητες των ανθρώπων, σύμφωνα με τις αναφορές των ερευνητών σε ένα άρθρο που δημοσιεύτηκε την περασμένη εβδομάδα στον προδημοσιευμένο σέρβερ arXiv.

 Η ομάδα του DeepMind δοκίμασε επίσης το νευρωνικό δίκτυο σε μια γλωσσική δραστηριότητα, κατά την οποία έλαβε ζεύγη από φράσεις όπως « Η Σάντρα ξεκίνησε να παίζει ποδόσφαιρο» και « Η Σάντρα πήγε στο γραφείο». Οι φράσεις αυτές συνοδεύτηκαν από ερωτήσεις όπως: «Που είναι το ποδόσφαιρο;» (Το γραφείο). Το νευρωνικό δίκτυο είχε σχεδόν τις ίδιες επιδόσεις με τους αλγορίθμους τεχνητής νοημοσύνης στα περισσότερα είδη ερωτήσεων, αλλά είχε εξαιρετικές επιδόσεις στις ερωτήσεις συμπεράσματος: «Η Λίλυ είναι κύκνος. Η Λίλη είναι λευκή. Ο Γκρεγκ είναι κύκνος. Τι χρώμα είναι ο Γκρεγκ;» (λευκός). Σε αυτές τις ερωτήσεις, το σχεσιακό δίκτυο σημείωσε 98%, ενώ καθένας από τους αντίπαλούς του περίπου 45%. Τελικά, ο αλγόριθμος ανέλυσε παραστάσεις στις οποίες 10 μπάλες κινούνταν τριγύρω, μερικές από τις οποίες ήταν συνδεδεμένες με αόρατα σχοινιά ή ράβδους. Χρησιμοποιώντας μόνο το μοτίβο της κίνησης, ήταν ικανό να ταυτοποιήσει πάνω από το 90% των συνδέσεων. Χρησιμοποίησε επίσης την ίδια τακτική ώστε να ταυτοποιήσει ανθρώπινες μορφές τις οποίες αναπαριστούσαν απλώς κινούμενες τελείες.

 «Ένα από τα δυνατά σημεία της προσέγγισής τους αποτελεί το γεγονός ότι είναι σχετικά απλό», υποστηρίζει η Kate Saenko, μία επιστήμονας υπολογιστών στο Boston University, η οποία δεν είχε εμπλακεί σε μια καινούργια εργασία, αλλά έχει επίσης αναπτύξει με μια ομάδα έναν αλγόριθμο που μπορεί να απαντήσει σύνθετες ερωτήσεις σχετικά με εικόνες. Αυτή η απλότητα -ο Lillicrap υποστηρίζει ότι το μεγαλύτερο μέρος της προόδου περικλείεται σε μία και μόνο εξίσωση- του επιτρέπει να συνδυάζεται με άλλα δίκτυα, όπως συνέβη στην εργασία σύγκρισης αντικειμένων. Το άρθρο το αποκαλεί «μια συσκευή που λειτουργεί μόλις ανιχνεύσει ότι συνδέθηκε με έναν υπολογιστή», η οποία επιτρέπει σε άλλα μέρη του συστήματος να εστιάσουν σε εκείνο στο οποίο είναι καλύτερα.

«Εντυπωσιάστηκα πολύ από τα αποτελέσματα», αναφέρει ο Justin Johnson, ένας επιστήμονας υπολογιστών στο Stanford University του Palo Alto στην California, ο οποίος ανέπτυξε μαζί με άλλους μια δραστηριότητα σύγκρισης- καθώς και έναν αλγόριθμο που είναι καλός σε αυτό. Ο Saenko επισημαίνει ότι ένα σχεσιακό δίκτυο θα μπορούσε μια μέρα να βοηθήσει στη μελέτη κοινωνικών δικτύων, να αναλύσει συστήματα επίβλεψης, ή να οδηγήσει αυτόνομα οχήματα μέσα στην κίνηση.

Για την προσέγγιση της ανθρώπινης ευελιξίας, θα πρέπει να μάθει να απαντά σε ερωτήσεις με μεγαλύτερη πρόκληση, υποστηρίζει ο Johnson. Πετυχαίνοντας κάτι τέτοιο, θα μπορούσε να μάθει να συγκρίνει όχι μόνο ζεύγη πραγμάτων, αλλά και τριπλέτες, ζεύγη από άλλα ζεύγη, ή μόνο ζεύγη σε μεγαλύτερα σύνολα (για καλύτερη αποτελεσματικότητα). «Θα με ενδιέφερε η ενασχόληση με πρότυπα που θα έχουν την δική τους στρατηγική», υποστηρίζει. «Η DeepMind δημιουργεί ένα ιδιαίτερο είδος λογικής σκέψης, και δεν ασχολείται με πιο γενικά είδη σχεσιακής λογικής σκέψης». Συνεχίζει ωστόσο να αποτελεί ένα εξαιρετικά σημαντικό βήμα προς τη σωστή κατεύθυνση».

Πηγή: sciencemag.org