27 Μαρτίου 2023

ChatGPT vs Google Bard: Σύγκριση των τεχνικών διαφορών

Περίληψη άρθρου:
Το ChatGPT και το Google Bard είναι chatbots τεχνητής νοημοσύνης που αναπτύχθηκαν από την OpenAI και την Google αντίστοιχα. Το ChatGPT κυκλοφόρησε τον Νοέμβριο του 2022 και έχει πάνω από 100 εκατομμύρια χρήστες, ενώ το Google Bard βρίσκεται ακόμη σε εξέλιξη και είναι διαθέσιμο μόνο σε λίγους και εκλεκτούς. Το ChatGPT τροφοδοτείται από το GPT-3.5, το οποίο εκπαιδεύεται σε κείμενο ιστού από το Common Crawl, ενώ το Bard τροφοδοτείται από το LaMDA της Google, το οποίο εκπαιδεύεται σε Common Crawl, Wikipedia και 1,56 τρισεκατομμύρια λέξεις δημόσιων δεδομένων διαλόγου και κειμένου ιστού. Το ChatGPT έχει περισσότερες παραμέτρους μοντέλου από το Bard, αλλά το Bard έχει σχεδιαστεί για να είναι πιο διαλογικό και μπορεί να έχει πρόσβαση σε πληροφορίες από το διαδίκτυο σήμερα. Και τα δύο βασίζονται σε νευρωνικά γλωσσικά μοντέλα που βασίζονται στον Transformer ενώ και τα δύο έχουν αντιμετωπίσει διαμάχες από την πλευρά των πνευματικών δικαιωμάτων και της ηθικής. Τελικά, οι τεχνικές διαφορές μεταξύ των δύο αποδεικνύουν πόσο μακριά έχει φτάσει η τεχνολογία παραγωγής κειμένου με τεχνητή νοημοσύνη.


Αναλυτικό Άρθρο:
Η μεγαλύτερη διαφορά μεταξύ του Google Bard και του ChatGPT είναι ότι, από τη στιγμή που γράφονται αυτές οι γραμμές, το Bard γνωρίζει για το ChatGPT, αλλά το ChatGPT αγνοεί το Bard. Μπορώ όμως να παίξω με το ChatGPT, ενώ το Google Bard εξακολουθεί να είναι απρόσιτο για τους περισσότερους από εμάς.

Η έναρξη της μάχης ChatGPT vs Google Bard
Τόσο το ChatGPT όσο και το Google Bard είναι chatbots τεχνητής νοημοσύνης. Η απλούστερη εκδοχή αυτής της τεχνολογίας υπάρχει ήδη στο smartphone σας - πληκτρολογείτε "Good" και το τηλέφωνό σας προβλέπει ότι η επόμενη λέξη που μπορεί να θέλετε να χρησιμοποιήσετε είναι "morning". Το ChatGPT αναπτύχθηκε αρχικά από την OpenAI και στη συνέχεια επενδύθηκε από τη Microsoft έναντι του ιλιγγιώδους ποσού των 10 δισεκατομμυρίων δολαρίων (επιπλέον μιας προηγούμενης επένδυσης ύψους 1 δισεκατομμυρίου δολαρίων).

Η Google, πανικοβλημένη ελαφρώς ότι το μονοπώλιο της αναζήτησης μπορεί να έφτανε στο τέλος του, απάντησε παρουσιάζοντας το Bard, τη δική της έκδοση της τεχνολογίας με κάποιες ατέλειες. Στην πρώτη κιόλας ζωντανή επίδειξή του, το Bard έκανε αρκετά πραγματικά λάθη. Το ChatGPT και το Google Bard είναι λίγο πιο εξελιγμένα από το προγνωστικό κείμενο του smartphone, αλλά για να καταλάβετε τις διαφορές μεταξύ των δύο AI chatbots, αυτό είναι το μόνο που χρειάζεται να ξέρετε για αρχή.

Ας ρίξουμε μια βαθύτερη ματιά στις τεχνικές διαφορές μεταξύ αυτών των δύο μηχανών τεχνητής νοημοσύνης.

ChatGPT

  • Μοντέλο: GPT-3.5
  • Αρχιτεκτονική Νευρωνικών Δικτύων: Μετασχηματιστή (Trasnformer)
  • Δεδομένα Κατάρτησης: κείμενο στο διαδίκτυο, κυρίως ένα σύνολο δεδομένων που ονομάζεται "common crawl", που διακόπτεται στα μέσα του 2021
  • Σκοπός: να είναι ένα chatbot κειμένου για όλες τις χρήσεις
  • Παράμετροι: 175 δισεκατομμύρια παράμετροι
  • Δημιουργός: OpenAI
  • Πλεονεκτήματα: 
    • Ανοιχτό για όλους τώρα
    • Πιο ευέλικτο και ικανό για ανοιχτό κείμενο
    • Τα δεδομένα κατάρτισης διακόπτονται το 2021- Δεδομένα κατάρτισης μέχρι σήμερα
  • Μειονεκτήματα:
    • Ο διάλογος δεν είναι τόσο πειστικός
    • Δεν είναι τόσο προσεκτικά ρυθμισμένος

Bard

  • Μοντέλο: LaMDA (γλωσσικό μοντέλο για εφαρμογές διαλόγου)
  • Αρχιτεκτονική Νευρωνικών Δικτύων: Μετασχηματιστή (Trasnformer)
  • Δεδομένα Κατάρτησης:1,56 εκατομμύρια λέξεις δημόσιων δεδομένων διαλόγου και διαδικτυακού κειμένου
  • Σκοπός: να βοηθήσει στην αναζήτηση
  • Παράμετροι: 137 δισεκατομμύρια παράμετροι
  • Δημιουργός: Google
  • Πλεονεκτήματα: 
    • Δεδομένα κατάρτισης μέχρι σήμερα
    • Εκπαιδευμένο ειδικά για διάλογο, ώστε να ακούγεται πιο ανθρώπινο όταν το χρησιμοποιείτε
  • Μειονεκτήματα:
    • Δεν είναι προς το παρόν διαθέσιμο
    • Μπορεί να μην είναι τόσο κατάλληλο για τη δημιουργία γενικού κειμένου


Τι είναι το ChatGPT;
Το ChatGPT εμφανίστηκε στη σκηνή στις 30 Νοεμβρίου 2022. Μέχρι τις 4 Δεκεμβρίου 2022, η υπηρεσία είχε πάνω από ένα εκατομμύριο καθημερινούς χρήστες. Τον Ιανουάριο του 2023, ο αριθμός αυτός εκτοξεύτηκε σε πάνω από 100 εκατομμύρια χρήστες. Ήταν αμέσως δημοφιλής για τον βασικό λόγο ότι μπορούσε να σας προσφέρει αξιόπιστες απαντήσεις σε διάφορα θέματα με τρόπο που ακουγόταν σχεδόν ανθρώπινος και ήταν προσβάσιμη σε οποιονδήποτε είχε σύνδεση στο διαδίκτυο.

Το ChatGPT δημιουργήθηκε από το OpenAI, ένα εργαστήριο τεχνητής νοημοσύνης με έδρα το Σαν Φρανσίσκο, το οποίο επικεντρώνεται στη δημιουργία μιας φιλικής τεχνητής νοημοσύνης. Το chatbot βασίζεται στο GPT-3.5, το οποίο είναι ένα μεγάλο γλωσσικό μοντέλο που, όταν του δίνεται κείμενο, μπορεί να συνεχίσει την προτροπή.

Το ChatGPT έλαβε επιπλέον εκπαίδευση - οι ανθρώπινοι εκπαιδευτές βελτίωσαν το μοντέλο αλληλεπιδρώντας μαζί του και "επιβράβευσαν" το μοντέλο για απαντήσεις υψηλότερης ποιότητας.

Δεδομένα εκπαίδευσης
Το GPT-3.5 εκπαιδεύτηκε σε ένα τεράστιο σύνολο δεδομένων κειμένου στο διαδίκτυο, συμπεριλαμβανομένου ενός δημοφιλούς συνόλου δεδομένων που ονομάζεται Common Crawl. Το Common Crawl περιέχει petabytes δεδομένων ιστού με ακατέργαστα δεδομένα ιστοσελίδων, αποσπάσματα μεταδεδομένων και αποσπάσματα κειμένου. Περιλαμβάνει, για παράδειγμα, μια συλλογή από δικές μας διευθύνσεις URL από το Strata Scratch.

Δεν είναι τρελό να σκέφτεσαι ότι το ChatGPT εκπαιδεύτηκε χρησιμοποιώντας ιστοσελίδες στις οποίες μπαίνουμε καθημερινά; Το Common Crawl ήταν υπεύθυνο για το 60% των δεδομένων εκπαίδευσης, αλλά το GPT-3.5 πήρε επίσης δεδομένα από άλλες πηγές.

Τι είναι το Google Bard;
Το Bard είναι η απάντηση της Google στη δημοτικότητα του ChatGPT. Σε αντίθεση με το ChatGPT, το Bard τροφοδοτείται από το μοντέλο LaMDA της Google, το οποίο είναι η συντομογραφία του Language Model for Dialogue Applications (γλωσσικό μοντέλο για εφαρμογές διαλόγου). Σε αντίθεση με το ChatGPT, δεν είναι τόσο συναρπαστικό για τον απλούστατο λόγο ότι οι περισσότεροι άνθρωποι δεν έχουν ακόμα πρόσβαση σε αυτό.

Αν και η Google φιλοξένησε ένα demo του Bard γεμάτο λάθη στις αρχές Φεβρουαρίου, αυτή τη στιγμή είναι διαθέσιμο μόνο σε λίγους και εκλεκτούς. Το κύριο πλεονέκτημα του Bard της Google είναι ότι είναι ανοιχτό στο διαδίκτυο. Ρωτήστε το ChatGPT ποιος είναι ο πρόεδρος και δεν ξέρει. Αυτό οφείλεται στο γεγονός ότι τα δεδομένα εκπαίδευσης διακόπηκαν γύρω στα μέσα του 2021.

Το Bard, εν τω μεταξύ, αντλεί πληροφορίες από το διαδίκτυο σήμερα. Ρωτήστε το Bard, και θεωρητικά, το Bard θα πρέπει να είναι σε θέση να αντλήσει από τα δεδομένα που είναι διαθέσιμα στο διαδίκτυο σήμερα για να σας πει ποιος είναι ο πρόεδρος. Παρόλο που δεν μπορείτε να το δοκιμάσετε ακόμα, είναι εύκολο να δείτε πώς το Bard ξεχωρίζει από το ChatGPT σε μερικά βασικά σημεία.

Δεδομένα κατάρτισης
Πρώτον, το LaMDA εκπαιδεύτηκε σε διάλογο, συγκεκριμένα για να μιλάει σε συνομιλία, και όχι απλώς να παράγει κείμενο όπως τα μοντέλα GPT. Ενώ το ChatGPT δεν κρύβει τα δεδομένα εκπαίδευσής του, απλά δεν γνωρίζουμε τόσα πολλά - ακόμα - για τα δεδομένα στα οποία εκπαιδεύτηκε το Bard. Μπορούμε να προεκτείνουμε λίγα πράγματα κοιτάζοντας την ερευνητική εργασία της LaMDA.

Οι ερευνητές της Google δήλωσαν ότι το 12,5% των δεδομένων εκπαίδευσης προήλθε από το Common Crawl, όπως και τα μοντέλα GPT-n. Ένα άλλο 12,5% προέρχεται από τη Wikipedia. Και σύμφωνα με το ερευνητικό έγγραφο, χρησιμοποίησαν 1,56 τρισεκατομμύρια λέξεις από "δημόσια δεδομένα διαλόγου και κείμενα ιστού".

Γνωρίζουμε τα δεδομένα του Common Crawl και προφανώς γνωρίζετε τη Wikipedia. Τα υπόλοιπα; Είναι σκόπιμα κρυμμένα, προφανώς για να κρατήσουν το Bard (και το LaMDA) ασφαλή από αντιγραφείς. Το LaMDA δημιουργήθηκε με την τελειοποίηση μιας οικογένειας νευρωνικών γλωσσικών μοντέλων με βάση το Transformer, τα οποία είναι μια αρχιτεκτονική νευρωνικών δικτύων ανοικτού κώδικα που αναπτύχθηκε αρχικά από την Google. (το GPT είναι επίσης βασισμένο στον Transformer).

Το ChatGPT έχει κάποιες προστατευτικές μπάρες για να μην γίνει πολύ άσχημο ή να μην ξεστομίσει πλήρεις ανοησίες, αλλά η Google έχει κάνει ένα πραγματικό σημείο για να τονίσει πώς έχει δημιουργήσει προσεκτικά εγγυήσεις ποιότητας για να κάνει το Bard ένα καλύτερο και ασφαλέστερο chatbot για χρήση. Το Bard έχει ρυθμιστεί λεπτομερώς ώστε να προάγει την "ποιότητα, τη γειτνίαση και την ασφάλεια".

Η Google έχει πολλά να πει γι' αυτό, και σας συνιστώ να διαβάσετε την ανάρτηση στο blog της σχετικά με αυτό, αλλά αν δεν έχετε πολύ χρόνο, βασικά αναλύεται ως εξής:

  • Το Bard πρέπει να δίνει απαντήσεις που βγάζουν νόημα - τίποτα παράλογο, καμία αντίφαση.
  • Το Bard πρέπει να δίνει απαντήσεις που είναι διορατικές και πνευματώδεις.
  • Το Bard θα πρέπει να αποφεύγει οτιδήποτε κινδυνεύει να βλάψει τον χρήστη.
  • Το Bard δεν πρέπει να επινοεί πράγματα.

Χάρη σε μια ελαττωματική εκτόξευση, γνωρίζουμε ήδη ότι η Google δεν έχει καταλάβει ακριβώς αυτή τη βασική απαίτηση. Αλλά είναι αξιοσημείωτο το γεγονός ότι η Google μιλάει τόσο ξεκάθαρα για αυτές τις απαιτήσεις σχεδιασμού με έναν τρόπο που το ChatGPT απλά δεν το έχει κάνει - τουλάχιστον όχι ακόμα.

ChatGPT vs Google Bard: Η παράμετρος του μοντέλου και γιατί έχει σημασία;
Το ChatGPT έχει όντως περισσότερες παραμέτρους μοντέλου από το Bard - 175 δισεκατομμύρια έναντι 137 δισεκατομμυρίων. Μπορείτε να σκεφτείτε τις παραμέτρους ως κουμπιά ή μοχλούς που το μοντέλο προσαρμόζει για να ταιριάζει στα δεδομένα στα οποία εκπαιδεύεται. Περισσότερες παράμετροι σημαίνουν γενικά ότι το μοντέλο έχει μεγαλύτερη ικανότητα να καταγράφει πολύπλοκες σχέσεις στη γλώσσα, αλλά υπάρχει επίσης ο κίνδυνος υπερβολικής προσαρμογής. Το Google Bard μπορεί να είναι λιγότερο ευέλικτο, αλλά μπορεί επίσης να είναι πιο ανθεκτικό σε νέες περιπτώσεις γλωσσικής χρήσης σε σύγκριση με το ChatGPT.

ChatGPT vs Google Bard: Τι κοινό έχουν;
Αξίζει να τονιστεί ότι τόσο το Bard όσο και το ChatGPT βασίζονται σε μοντέλα (LaMDA και GPT-3.5 αντίστοιχα) που βασίζονται σε νευρωνικά δίκτυα βαθιάς μάθησης με βάση τον Transformer. Ο Transformer μπορεί να κάνει ένα μοντέλο που έχει εκπαιδευτεί να διαβάζει μια πρόταση ή μια παράγραφο, για παράδειγμα, να δίνει προσοχή στο πώς αυτές οι λέξεις σχετίζονται μεταξύ τους και στη συνέχεια να προβλέπει ποιες λέξεις πιστεύει ότι θα ακολουθήσουν - παρόμοια με την πρόβλεψη κειμένου του smartphone σας.

ChatGPT vs Google Bard: Ιδιοκτησία
Το Google Bard παράγεται και ανήκει εξ ολοκλήρου στην Google, πάνω από το LaMDA, το οποίο επίσης δημιουργήθηκε από την Google. Το ChatGPT αναπτύσσεται από την OpenAI, ένα ερευνητικό εργαστήριο τεχνητής νοημοσύνης. Το OpenAI ήταν αρχικά μη κερδοσκοπικό, αλλά δημιούργησε μια κερδοσκοπική θυγατρική το 2019. Το OpenAI βρισκόταν επίσης πίσω από το Dall-E, τη δημιουργία τεχνητής νοημοσύνης από κείμενο σε εικόνα με την οποία ίσως έχετε παίξει. Ενώ η Microsoft έχει επενδύσει πολλά χρήματα στο OpenAI, είναι, προς το παρόν, ένας ανεξάρτητος ερευνητικός οργανισμός.

Ποιο είναι το καλύτερο, το ChatGPT ή το Google Bard;
Είναι δύσκολο να δοθεί μια δίκαιη απάντηση σε αυτή την ερώτηση, επειδή και οι δύο είναι τόσο παρόμοιες, αλλά και τόσο διαφορετικές. Πρώτον, σχεδόν κανείς δεν μπορεί να έχει πρόσβαση στο Google Bard αυτή τη στιγμή. Αφετέρου, τα δεδομένα εκπαίδευσης του ChatGPT διακόπηκαν πριν από σχεδόν δύο χρόνια.

Και οι δύο είναι γεννήτριες κειμένου - δίνετε μια προτροπή και τόσο το Google Bard όσο και το ChatGPT μπορούν να την απαντήσουν. Και τα δύο έχουν δισεκατομμύρια παραμέτρους για τη ρύθμιση του μοντέλου. Και τα δύο έχουν αλληλεπικαλυπτόμενες πηγές δεδομένων εκπαίδευσης, και τα δύο βασίζονται στο Transformer, το ίδιο μοντέλο νευρωνικού δικτύου.

Έχουν σχεδιαστεί για διαφορετικούς σκοπούς, επίσης. Το Bard θα σας βοηθήσει να πλοηγηθείτε στην αναζήτηση της Google. Έχει σχεδιαστεί για να είναι διαλογική. Το ChatGPT μπορεί να δημιουργήσει ολόκληρες αναρτήσεις σε ιστολόγια. Έχει σχεδιαστεί για να βγάζει κομμάτια κειμένου που βγάζουν νόημα.

Τελικά, οι τεχνικές διαφορές μεταξύ του ChatGPT και του Google Bard υπογραμμίζουν πόσο μακριά έχει φτάσει η τεχνολογία παραγωγής κειμένου με τεχνητή νοημοσύνη. Παρόλο που και οι δύο έχουν δρόμο να διανύσουν και οι δύο έχουν αντιμετωπίσει διαμάχες σχετικά με τα πνευματικά δικαιώματα και την ηθική πλευρά των πραγμάτων, και οι δύο γεννήτριες αποτελούν ισχυρές επιδείξεις των σύγχρονων μοντέλων τεχνητής νοημοσύνης.

Πηγή: ChatGPT vs Google Bard: Σύγκριση των τεχνικών διαφορών