Η απάντηση της Google Search στο ChatGPT

24/08/2023 | |

Περίληψη άρθρου:
Η Google εισήγαγε μια λειτουργία αναζήτησης με τεχνητή νοημοσύνη που ονομάζεται SGE, αλλά οι χρήστες τη βρίσκουν αργή, ανακριβή και αναξιόπιστη. Η Google σχεδιάζει να τη βελτιώσει με βάση τα σχόλια. Η γεννήτρια AI του Midjourney βελτιώνει τα χέρια χωρίς τροποποιήσεις, ενώ η νέα έκδοση του Stability AI επικεντρώνεται στη δημιουργία καλύτερων εικόνων χεριών. Η εταιρεία δοκιμάζει διαφορετικές προσεγγίσεις για τη βελτίωση. Ο Στίβεν θα συζητήσει τα χέρια με ανοιχτόχρωμο δέρμα σε ένα μελλοντικό άρθρο.

Κύρια σημεία του άρθρου:

Η Google έχει αναπτύξει μια μηχανή αναζήτησης με τεχνητή νοημοσύνη που ονομάζεται Search Generative Experience (SGE) για την παροχή λειτουργιών συνομιλίας και τη δημιουργία απαντήσεων που δημιουργούνται από τεχνητή νοημοσύνη.
Ωστόσο, στην πράξη, η SGE είναι αργή, αναποτελεσματική και συχνά ανακριβής.
Η Google αναγνωρίζει ότι η SGE βρίσκεται ακόμη σε πρώιμο στάδιο ανάπτυξης και στοχεύει να κυκλοφορήσει στο μέλλον μια ταχύτερη και λιγότερο ακατάστατη έκδοση.
Η έκδοση 5 της γεννήτριας AI του Midjourney έδειξε μέτριες βελτιώσεις στη δημιουργία εικόνων χεριών χωρίς να έχουν γίνει συγκεκριμένες αλλαγές για τα χέρια.

Αναλυτικά το άρθρο:
Η νέα μηχανή αναζήτησης της Google με τεχνητή νοημοσύνη μπορεί να μοιάζει περισσότερο με τεχνητή παρέμβαση παρά με τεχνητή νοημοσύνη.

ΤΟ ΠΕΡΑΣΜΕΝΟ ΣΑΒΒΑΤΟΚΥΡΙΑΚΟ, στράφηκα στην αναζήτηση Google για να βρω πόσα γραμματόσημα έπρεπε να βάλω σε ένα ταχυδρομείο 8 ουγγιών. (Φυσικά, έστελνα ένα αντίγραφο του τελευταίου τεύχους του WIRED!). Είναι ακριβώς το είδος της ερώτησης που ήλπιζα ότι η νέα λειτουργία γεννητικής Τεχνητής Νοημοσύνης της Google Search, την οποία δοκιμάζω τον τελευταίο μήνα, θα έλυνε πολύ πιο γρήγορα από ό,τι θα μπορούσα εγώ με τη δική μου περιήγηση.

Η αδέξια ονομασία Search Generative Experience, SGE για συντομία, της Google εμπλουτίζει το πλαίσιο αναζήτησής της με λειτουργικότητα συνομιλίας τύπου ChatGPT. Μπορείτε να εγγραφείτε στο Search Labs της Google. Η εταιρεία λέει ότι θέλει οι χρήστες να συνομιλούν με το chatbot της αναζήτησης, το οποίο ξεκίνησε να διατίθεται σε δοκιμαστές τον Μάιο, για να εμβαθύνουν σε θέματα και να κάνουν πιο απαιτητικές και διαισθητικές ερωτήσεις από ό,τι θα πληκτρολογούσαν σε ένα βαρετό παλιό πλαίσιο ερωτήσεων. Και οι απαντήσεις που δημιουργούνται με τεχνητή νοημοσύνη έχουν σκοπό να οργανώνουν τις πληροφορίες με μεγαλύτερη σαφήνεια από ό,τι μια παραδοσιακή σελίδα αποτελεσμάτων αναζήτησης - για παράδειγμα, συγκεντρώνοντας πληροφορίες από πολλούς ιστότοπους. Οι περισσότερες από τις παγκόσμιες διαδικτυακές αναζητήσεις πραγματοποιούνται μέσω της Google και αναπτύσσει τεχνολογίες τεχνητής νοημοσύνης περισσότερο από τις περισσότερες εταιρείες, οπότε είναι δίκαιο να περιμένουμε μια κορυφαία εμπειρία.

Έτσι λέει η θεωρία. Αποδεικνύεται ότι στην πράξη η νέα λειτουργία είναι περισσότερο ενοχλητική παρά βοηθητική. Είναι αργή, αναποτελεσματική, φλύαρη και ακατάστατη - περισσότερο τεχνητή παρέμβαση παρά νοημοσύνη.

Μόλις αποκτήσετε πρόσβαση στη δοκιμή της Google, το πλαίσιο αναζήτησης φαίνεται αμετάβλητο. Αλλά σε απάντηση σε ένα ερώτημα όπως "Πόσα γραμματόσημα για να ταχυδρομήσω επιστολή 8 ουγγιών", ένα νέο τμήμα καταλαμβάνει ένα μεγάλο κομμάτι της οθόνης, πιέζοντας προς τα κάτω τη συμβατική λίστα συνδέσμων. Μέσα σε αυτή την περιοχή, τα μεγάλα γλωσσικά μοντέλα της Google δημιουργούν μερικές παραγράφους παρόμοιες με αυτές που μπορεί να βρείτε από το ChatGPT ή το Bing Chat της Microsoft. Τα κουμπιά στο κάτω μέρος οδηγούν σε μια διεπαφή chatbot όπου μπορείτε να κάνετε ερωτήσεις παρακολούθησης.

Το πρώτο πράγμα που παρατήρησα στο όραμα της Google για το μέλλον της αναζήτησης ήταν η βραδύτητά του. Σε δοκιμές όπου με το ένα χέρι έλεγχα μια εφαρμογή χρονόμετρου και με το άλλο υπέβαλα ένα ερώτημα, μερικές φορές χρειάστηκαν σχεδόν έξι δευτερόλεπτα για να βγάλει η γεννήτρια κειμένου της Google την απάντησή της. Ο κανόνας ήταν πάνω από τρία δευτερόλεπτα, σε σύγκριση με το ένα δευτερόλεπτο για να εμφανιστούν τα συμβατικά αποτελέσματα της Google. Τα πράγματα θα μπορούσαν να είναι και χειρότερα: έκανα τις δοκιμές μου αφού η Google κυκλοφόρησε μια ενημέρωση που ισχυρίζεται ότι διπλασίασε την ταχύτητα του ρομπότ αναζήτησης τον περασμένο μήνα. Ωστόσο, εξακολουθώ συχνά να βρίσκομαι βαθιά μέσα στην ανάγνωση των κανονικών αποτελεσμάτων μέχρι να τελειώσει η γεννητική τεχνητή νοημοσύνη, πράγμα που σημαίνει ότι καταλήγω να αγνοώ τις διατριβές που υπέβαλε με καθυστέρηση. Η Cathy Edwards, αντιπρόεδρος της Google Search, μου λέει ότι η βελτιστοποίηση της ταχύτητας του λογισμικού AI που υποστηρίζει το εργαλείο βρίσκεται σε εξέλιξη.

Θα μπορούσε κανείς να συγχωρέσει την βραδύτητα αυτής της νέας μορφής αναζήτησης αν τα αποτελέσματα άξιζαν τον κόπο. Αλλά η ακρίβεια είναι ασταθής. Η γεννητική απάντηση της Google σε πέντε προτάσεις AI στην ερώτησή μου για τα γραμματόσημα περιελάμβανε προφανή λάθη τόσο στον πολλαπλασιασμό όσο και στην αφαίρεση, τιμές γραμματοσήμων ξεπερασμένες κατά δύο χρόνια και προτεινόμενες ερωτήσεις παρακολούθησης που αγνοούσαν κρίσιμες μεταβλητές για τα έξοδα αποστολής, όπως το σχήμα, το μέγεθος και τον προορισμό. Η δήλωση αποποίησης ευθύνης που εμφανίζει η Google στην κορυφή κάθε απάντησης που δημιουργείται από τεχνητή νοημοσύνη ήταν ηχηρά αληθινή: "Η γεννητική τεχνητή νοημοσύνη είναι πειραματική. Η ποιότητα των πληροφοριών μπορεί να ποικίλλει".

Στην ίδια απάντηση, η νέα λειτουργία αναζήτησης της Google μου πρότεινε ότι θα χρειαζόμουν γραμματόσημα αξίας 2,47 ή 4 δολαρίων. Η πλοήγηση στην ηλεκτρονική αριθμομηχανή της Ταχυδρομικής Υπηρεσίας των ΗΠΑ έδωσε την επίσημη απάντηση: Χρειαζόμουν 3,03 δολάρια ή πέντε γραμματόσημα των 66 σεντς το καθένα με 27 σεντς υπερχρέωση. Ο Έντουαρντς της Google λέει ότι το ταπεινό μου ερώτημα ξεπέρασε τα σημερινά όρια της τεχνολογίας. "Είναι σίγουρα στα σύνορα", λέει.

Δυστυχώς, ούτε η αποβλάκωση είχε καλό τέλος. Όταν ζητήθηκε μόνο η τιμή ενός γραμματοσήμου, η Google απάντησε με ένα ξεπερασμένο νούμερο. Μόνο διευκρινίζοντας ότι ήθελα την τιμή του τρέχοντος μήνα, το σύστημα αντικατέστησε σωστά την αύξηση του κόστους κατά 3 λεπτά του τρέχοντος μήνα. Για να είμαστε δίκαιοι, το ChatGPT θα αποτύγχανε και σε αυτό το ερώτημα, επειδή τα δεδομένα εκπαίδευσής του διακόπτονται το 2021 - αλλά δεν τοποθετείται ως αντικαταστάτης μιας μηχανής αναζήτησης.

Η νέα εμπειρία αναζήτησης της Google είναι αρκετά αναξιόπιστη ώστε να είναι καλύτερα να κάνω κλικ στα τυπικά αποτελέσματα για να διεξάγω τη δική μου έρευνα. Ένα ερώτημα σχετικά με τα βιντεοπαιχνίδια Star Wars που αναπτύχθηκαν από την εταιρεία παιχνιδιών Electronic Arts δημιούργησε έναν ακριβή κατάλογο, εκτός από τη συμπερίληψη ενός τίτλου από τον αντίπαλο της EA, την Ubisoft. Κατά ειρωνεία της τύχης, η περιγραφή του παιχνιδιού από τη γεννητική τεχνητή νοημοσύνη στο αποτέλεσμα ανέφερε ότι κατασκευάστηκε από την Ubisoft, αποδεικνύοντας πώς τα μεγάλα γλωσσικά μοντέλα μπορούν να αντιφάσκουν μεταξύ τους.

Όταν ρωτήθηκε σχετικά με τους παίκτες τους οποίους οι San Diego Padres -που σίγουρα θα νικήσουν τους Phillies του Στίβεν στην wild card- θα μπορούσαν να προσπαθήσουν να αποκτήσουν μέσω ανταλλαγής με άλλη ομάδα του μπέιζμπολ, η απάντηση της Τεχνητής Νοημοσύνης της Google ξεκίνησε με δύο παίκτες που βρίσκονται αυτή τη στιγμή στους Padres, μπερδεύοντας τις εμπορικές μάρκες με τους εμπορικούς στόχους.

Η Google έχει θέσει ορισμένα προστατευτικά μέτρα. Η νέα εμπειρία αναζήτησης δεν εμφανίζεται για ορισμένα ερωτήματα υγείας ή οικονομικά, για τα οποία η Google έχει θέσει υψηλότερο πήχη για την ακρίβεια. Και η εμπειρία διαθέτει σχεδόν πάντα σε περίοπτη θέση συνδέσμους προς σχετικές πηγές στο διαδίκτυο για να βοηθήσει τους χρήστες να επιβεβαιώσουν τα αποτελέσματα της τεχνητής νοημοσύνης. Τα αποτελέσματα σε ερωτήματα όπως "Γράψτε ένα ποίημα" έχουν την αποποίηση ευθυνών "Μπορεί να δείτε ανακριβές δημιουργικό περιεχόμενο". Και το σύστημα ΤΝ γενικά δεν προσπαθεί να ακούγεται πολύ χαριτωμένο ή να υιοθετεί μια προσωπικότητα. "Δεν πιστεύουμε ότι οι άνθρωποι πραγματικά θέλουν να μιλήσουν στην Google", λέει ο Edwards, κάνοντας μια αντίθεση με το Bing Chat, το οποίο είναι γνωστό ότι μπαίνει σε ομιλία πρώτου προσώπου ή πασπαλίζει emojis.

Μερικές φορές, το νέο όραμα της Google για την αναζήτηση μπορεί να μοιάζει περισσότερο με ένα βήμα πίσω παρά με ένα άλμα προς το μέλλον. Οι παραγόμενες απαντήσεις μπορούν να αντιγράψουν άλλα χαρακτηριστικά στη σελίδα αποτελεσμάτων, όπως τα προτεινόμενα αποσπάσματα που αντλούν μια σαφή και εύπεπτη απάντηση από έναν ιστότοπο ή τα πλαίσια γνώσης που παρέχουν μια επισκόπηση ενός θέματος σε μήκος παραγράφου από τη Wikipedia. Όταν καθυστερημένα χτυπάει σε αποτελέσματα όπως αυτά, η γεννητική εκδοχή της ΤΝ τείνει να είναι η πιο φλύαρη και πιο δύσκολη στο να την κατανοήσει κανείς.

Ο Edwards ανέφερε τουλάχιστον οκτώ φορές κατά τη διάρκεια της 30λεπτης συζήτησής μας σχετικά με τις εμπειρίες μου με τη νέα λειτουργία ότι είναι ακόμα σε πρώιμο στάδιο ανάπτυξης και ότι υπάρχουν πολλά προβλήματα που πρέπει να διορθωθούν. "Δεν νομίζω ότι θα με ακούσετε να λέω ότι το έχουμε καταφέρει", λέει. "Βρισκόμαστε στην αρχή ενός τόξου μετασχηματισμού που διαρκεί 10 χρόνια". Λέει επίσης ότι η ανατροφοδότηση μέχρι σήμερα ήταν "εξαιρετικά θετική", αλλά ίσως το πιο σημαντικό, λέει ότι αυτό που η Google τελικά λανσάρει σε όλους τους χρήστες "μπορεί να μοιάζει αρκετά διαφορετικό από αυτό που βρισκόμαστε σήμερα".

Μια εμπειρία που θα είναι πιο γρήγορη, λιγότερο φορτωμένη με περιεχόμενο και ικανή να βοηθήσει στην αποστολή των τευχών του WIRED στους αναγνώστες χωρίς να κινδυνεύουν να επιστραφούν λόγω ελλιπώς πληρωμένων ταχυδρομικών τελών, θα ήταν ωραία.

Ταξίδι στο χρόνο

Η προσπάθεια της Google να απαντά μεστότερα στις ερωτήσεις των χρηστών με άμεσες απαντήσεις ξεκίνησε πριν από χρόνια. Το 2016, ο τότε συγγραφέας του WIRED, Cade Metz, έγραψε για το πώς η Google συγκέντρωσε περίπου 100 διδάκτορες γλωσσολογίας με ευχέρεια σε περίπου δύο δωδεκάδες γλώσσες για να συμπυκνώσουν τα γραπτά και να σχολιάσουν προτάσεις για να βοηθήσουν στην εκπαίδευση συστημάτων τεχνητής νοημοσύνης ώστε να κατανοήσουν πώς λειτουργεί η ανθρώπινη γλώσσα. Η Google ανέμενε ότι η ομάδα και η τεχνολογία θα αναπτυσσόταν για τα επόμενα χρόνια.

Αυτοί οι "αλγόριθμοι συμπίεσης προτάσεων" μόλις τέθηκαν σε λειτουργία στην επιτραπέζια ενσάρκωση της μηχανής αναζήτησης. Χειρίζονται μια εργασία που είναι αρκετά απλή για τους ανθρώπους, αλλά παραδοσιακά ήταν αρκετά δύσκολη για τις μηχανές. Δείχνουν πώς η βαθιά μάθηση προάγει την τέχνη της κατανόησης της φυσικής γλώσσας, την ικανότητα κατανόησης και ανταπόκρισης στη φυσική ανθρώπινη ομιλία. "Πρέπει να χρησιμοποιήσετε νευρωνικά δίκτυα -ή τουλάχιστον αυτός είναι ο μόνος τρόπος που έχουμε βρει για να το κάνουμε", λέει ο διευθυντής ερευνητικών προϊόντων της Google, David Orr, για το έργο της εταιρείας στη συμπίεση προτάσεων.

Η Google εκπαιδεύει αυτά τα νευρωνικά δίκτυα χρησιμοποιώντας δεδομένα που έχουν δημιουργηθεί από μια τεράστια ομάδα διδακτορικών γλωσσολόγων που αποκαλεί Pygmalion. Στην πραγματικότητα, οι μηχανές της Google μαθαίνουν πώς να εξάγουν σχετικές απαντήσεις από μεγάλες σειρές κειμένου παρακολουθώντας τους ανθρώπους να το κάνουν - ξανά και ξανά. Αυτές οι επίπονες προσπάθειες δείχνουν τόσο τη δύναμη όσο και τους περιορισμούς της βαθιάς μάθησης. Για να εκπαιδεύσετε τεχνητά ευφυή συστήματα όπως αυτό, χρειάζεστε πάρα πολλά δεδομένα που έχουν κοσκινίσει η ανθρώπινη νοημοσύνη. Αυτό το είδος δεδομένων δεν είναι εύκολο ή φθηνό. Και η ανάγκη γι' αυτά δεν πρόκειται να εξαφανιστεί σύντομα.

Αλλά μόλις ένα χρόνο αργότερα, οι ερευνητές της Google επινόησαν μια νέα προσέγγιση για την εκπαίδευση της τεχνητής νοημοσύνης που έκανε μεγάλο μέρος αυτής της προετοιμασίας περιττό και οδήγησε στα μεγάλα γλωσσικά μοντέλα που αποτελούν τη βάση για υπηρεσίες όπως το ChatGPT και το νέο Google Search. Κοιτάζοντας πίσω, δεν θα με πείραζε καθόλου να έχω τα ευκρινή αποσπάσματα απαντήσεων της Αναζήτησης Google των προηγούμενων ετών.

Ρωτήστε με ένα πράγμα

Η Jennifer Phoenix, μέσω Facebook, ρωτάει γιατί οι γεννήτριες εικόνων τεχνητής νοημοσύνης συνεχίζουν να κάνουν λάθος στα χέρια και τα δάχτυλα. "Διαβάζω ότι οφείλεται στην πολυπλοκότητα", λέει, "αλλά θα έλεγα ότι το φάρμακο είναι περισσότερη εκπαίδευση σε αυτά τα χαρακτηριστικά".

Συμφωνώ μαζί σου, Τζένιφερ. Αφού διάβασα την ερώτησή σας, δοκίμασα να δημιουργήσω εικόνες του "χεριού με δαχτυλίδι τατουάζ με τον ήλιο που δύει" σε μια δοκιμαστική έκδοση του εργαλείου AI Stable Diffusion. Η παρτίδα των τεσσάρων αποτελεσμάτων που πήρα πίσω παρουσίαζε αποσπασματικά, ταλαντευόμενα δάχτυλα και χέρια με ελλείποντα δάχτυλα, αφύσικα λεπτούς καρπούς ή γιγαντιαίες αρθρώσεις. Αντίθετα, το ερώτημα "πρόσωπο με τατουάζ στο μάγουλο με τον ήλιο που δύει" οδήγησε σε μερικές άγριες εικόνες, αλλά τουλάχιστον τα πρόσωπα έμοιαζαν ρεαλιστικά.

Ο Pranav Dixit έκανε μια βαθιά κατάδυση για το BuzzFeed News (RIP) νωρίτερα φέτος στην ιστορία των χεριών στην τέχνη και έγραψε ότι το γεγονός ότι τα χέρια των ανθρώπων είναι συχνά απασχολημένα -κρατώντας φλιτζάνια, για παράδειγμα- μπορεί να εξηγήσει γιατί τα συστήματα τεχνητής νοημοσύνης δυσκολεύονται να τα αναπαραστήσουν ρεαλιστικά. Ο Kyle Chayka του New Yorker εξέτασε επίσης το θέμα, επισημαίνοντας ότι η παροχή ακριβέστερων εντολών στις γεννήτριες εικόνων AI σχετικά με το τι πρέπει να κάνουν τα χέρια μπορεί να βοηθήσει.

Όπως λες και εσύ, Τζένιφερ, το να ρίχνεις καλύτερα ή πιο διαφορετικά δεδομένα στα συστήματα τεχνητής νοημοσύνης θα πρέπει συχνά να οδηγεί σε πιο ακριβή αποτελέσματα. Ορισμένοι χρήστες εντόπισαν μέτριες βελτιώσεις στην απόδοση των χεριών στην "v5" της γεννήτριας AI του Midjourney νωρίτερα φέτος. Αλλά ο διευθύνων σύμβουλος της Midjourney David Holz μου λέει μέσω email ότι η εταιρεία "δεν έκανε τίποτα συγκεκριμένο για τα χέρια. Τα πράγματά μας απλώς λειτουργούν καλύτερα στο v5".

Από την άλλη πλευρά, ο προγραμματιστής του Stable Diffusion Stability AI εργάστηκε ειδικά για το πρόβλημα των χεριών κατά την ανάπτυξη της νεότερης έκδοσής του, η οποία κυκλοφόρησε αυτή την εβδομάδα. Ο Joe Penna, επικεφαλής του τμήματος εφαρμοσμένης μηχανικής μάθησης της Stability, λέει ότι τα κακώς παραγόμενα χέρια ήταν το κυριότερο παράπονο των χρηστών. Όταν δοκίμασα το νέο μοντέλο με το ερώτημά μου για τατουάζ χεριών, δύο εικόνες βγήκαν καλές, ενώ στις άλλες δύο έλειπαν κάποιες αρθρώσεις.

Το νέο μοντέλο έχει περίπου οκταπλάσια ικανότητα από τον προκάτοχό του να μαθαίνει οπτικά μοτίβα προς αναπαραγωγή, πράγμα που ουσιαστικά σημαίνει ότι μπορεί να θυμάται περισσότερα για το πώς πρέπει να φαίνονται τα χέρια, λέει ο Penna. Η εταιρεία του έδωσε επίσης πρόσθετη εκπαίδευση σε εικόνες ανθρώπων και έργων τέχνης, ώστε να αντικατοπτρίζει αυτό που ενδιαφέρει περισσότερο τους χρήστες. Τώρα, λέει ο Penna, "θυμάται πολύ περισσότερο πράγματα όπως τα χέρια".

Η εισαγωγή εκατομμυρίων πρόσθετων εικόνων χεριών στα δεδομένα εκπαίδευσης επιδείνωσε στην πραγματικότητα τις παραγόμενες εικόνες χεριών, κάνοντάς τες υπερμεγέθεις, λέει ο Penna, αλλά λέει ότι η εταιρεία δοκιμάζει διαφορετικές τακτικές για να οδηγήσει σε περαιτέρω βελτίωση.

Πριν μιλήσω με τον Penna, υπέθεσα ότι οι προγραμματιστές τεχνητής νοημοσύνης ίσως θέλουν να αποφύγουν την επίτευξη της τελειότητας, επειδή τα ατελή χέρια είναι ένας συνηθισμένος τρόπος για να εντοπίζονται οι βαθιές απομιμήσεις. Ο Penna λέει ότι αυτό δεν ίσχυε, αλλά ότι η Stability έλαβε άλλα μέτρα για να διασφαλίσει ότι είναι προφανές πότε οι εικόνες έχουν παραχθεί με την τεχνολογία της. "Δεν πρόκειται να επιστρέψουμε στην κατασκευή χειρότερων χεριών, οπότε ας αρχίσουμε να είμαστε πολύ προσεκτικοί με τις εικόνες που βλέπουμε στο διαδίκτυο", λέει.

Με τις αστοχίες στην οστική δομή να αρχίζουν να διευθετούνται, ίσως στη συνέχεια οι εταιρείες μπορούν να ασχοληθούν με το γεγονός ότι και οι 12 εικόνες που δημιούργησα από τις δοκιμαστικές μου προτροπές απεικόνιζαν χέρια με ανοιχτόχρωμο δέρμα; Θα αφήσω την εξήγηση γι' αυτό στον Steven σε ένα μελλοντικό Plaintext.

Πηγή: Hands On With Google Search’s Answer to ChatGPT