Πώς να αξιοποιήσετε μεγάλα γλωσσικά μοντέλα χωρίς να καταστρέψετε την τράπεζα

22/08/2023 | | |

Περίληψη άρθρου:
Η γεννητική τεχνητή νοημοσύνη, που τροφοδοτείται από μεγάλα γλωσσικά μοντέλα, μεταμορφώνει τις επιχειρήσεις. Ωστόσο, πρέπει να αντιμετωπιστούν προκλήσεις όπως η ειλικρίνεια του μοντέλου, η μεροληψία και το κόστος εκπαίδευσης. Μια σημαντική πρόκληση είναι το υψηλό κόστος λειτουργίας μεγάλων γεννητικών μοντέλων στην παραγωγή σε σύγκριση με άλλα μοντέλα μηχανικής μάθησης. Εταιρείες όπως η Microsoft, η AWS και η Google βρίσκονται σε μια "κούρσα εξοπλισμών τεχνητής νοημοσύνης" για να κυριαρχήσουν στον συγκεκριμένο τομέα. Τα ιδιόκτητα μοντέλα έχουν σημειώσει σημαντική πρόοδο στον κλάδο, αλλά τα μοντέλα ανοικτού κώδικα κερδίζουν έδαφος λόγω της ευελιξίας και του χαμηλότερου κόστους τους. Οι εταιρείες πρέπει να λαμβάνουν υπόψη τους αυτά τα κόστη κατά τον σχεδιασμό της δομής τιμολόγησης και του επιχειρηματικού τους μοντέλου. Μια υβριδική προσέγγιση που συνδυάζει τα ιδιόκτητα μοντέλα και τα μοντέλα ανοικτού κώδικα μπορεί να είναι το μέλλον. Τα μοντέλα ανοικτού κώδικα, όπως το LLaMA 2 της Meta και η οικογένεια μοντέλων της Cerebras, προσφέρουν ευελιξία και αποδοτικότητα κόστους. Επιτρέπουν μεγαλύτερο έλεγχο και μπορούν να εκτελούνται σε διάφορες πλατφόρμες υλικού. Η δύναμη του ανοιχτού κώδικα έγκειται στην ικανότητά του να προωθεί την καινοτομία, καθιστώντας τα μοντέλα τεχνητής νοημοσύνης ανοιχτά προσβάσιμα στους προγραμματιστές παγκοσμίως. Αυτό ευνοεί τη συνεργασία, την προσαρμογή και τη βελτίωση προς όφελος όλων. Ένας κόσμος όπου οι προγραμματιστές έχουν τη δυνατότητα επιλογής μεταξύ μοντέλων ανοικτού κώδικα, έτοιμων ή προσαρμοσμένων μοντέλων προσφέρει ατελείωτες δυνατότητες για την πρόοδο στη γεννητική ΤΝ.

Κύρια σημεία του άρθρου:

Το κόστος λειτουργίας μεγάλων γεννητικών μοντέλων ΤΝ στην παραγωγή αποτελεί σημαντική απειλή για την καινοτομία.
Τα μοντέλα ανοικτού κώδικα προσφέρουν ευελιξία, απόδοση και εξοικονόμηση κόστους σε σύγκριση με τα ιδιόκτητα μοντέλα.
Μια υβριδική προσέγγιση, που χρησιμοποιεί τόσο ιδιόκτητα μοντέλα όσο και μοντέλα ανοικτού κώδικα, είναι η πιο βιώσιμη επιλογή για πολλές εταιρείες.
Τα μοντέλα ανοικτού κώδικα κερδίζουν έδαφος λόγω της προσβασιμότητάς τους και της ικανότητάς τους να λειτουργούν σε διάφορα συστήματα υλικού.
Τα μοντέλα ανοικτού κώδικα προωθούν την καινοτομία και την προσαρμογή για τους προγραμματιστές, τους ερευνητές και τους καινοτόμους, οδηγώντας σε ατελείωτες δυνατότητες στον τομέα της παραγωγικής τεχνητής νοημοσύνης.

Αναλυτικά το άρθρο:
Η γενετική τεχνητή νοημοσύνη συνεχίζει να κυριαρχεί στα πρωτοσέλιδα των εφημερίδων. Στην αρχή της εμφάνισής της, όλοι μας παρασυρθήκαμε από την καινοτομία της. Αλλά τώρα έχουμε ξεπεράσει κατά πολύ τη διασκέδαση και τα παιχνίδια - βλέπουμε τον πραγματικό αντίκτυπό της στις επιχειρήσεις. Και όλοι βουτάνε με το κεφάλι μέσα.

Η MSFT, η AWS και η Google έχουν διεξάγει μια πλήρη "κούρσα εξοπλισμών τεχνητής νοημοσύνης" με στόχο την επικράτηση. Οι επιχειρήσεις κάνουν εσπευσμένα αλλαγές με το φόβο μήπως μείνουν πίσω ή χάσουν μια τεράστια ευκαιρία. Νέες εταιρείες που τροφοδοτούνται από μεγάλα γλωσσικά μοντέλα (LLMs) αναδύονται κάθε λεπτό, τροφοδοτούμενες από VCs που επιδιώκουν το επόμενο στοίχημά τους.

Αλλά με κάθε νέα τεχνολογία έρχονται και προκλήσεις. Η ειλικρίνεια και η μεροληψία των μοντέλων και το κόστος της εκπαίδευσης είναι μεταξύ των θεμάτων της ημέρας. Η ταυτότητα και η ασφάλεια, αν και σχετίζονται με την κατάχρηση των μοντέλων και όχι με ζητήματα που είναι εγγενή στην τεχνολογία, αρχίζουν επίσης να γίνονται πρωτοσέλιδα.

Το κόστος λειτουργίας των μοντέλων αποτελεί σημαντική απειλή για την καινοτομία

Η δημιουργική τεχνητή νοημοσύνη επαναφέρει επίσης την παλιά καλή διαμάχη μεταξύ ανοικτού και κλειστού κώδικα. Ενώ και τα δύο έχουν τη θέση τους στην επιχείρηση, το ανοιχτό λογισμικό προσφέρει χαμηλότερο κόστος για την ανάπτυξη και τη λειτουργία στην παραγωγή. Προσφέρουν επίσης μεγάλη προσβασιμότητα και επιλογές. Ωστόσο, βλέπουμε τώρα μια αφθονία μοντέλων ανοιχτού κώδικα, αλλά όχι αρκετή πρόοδο στην τεχνολογία για να τα αναπτύξουμε με βιώσιμο τρόπο.

Πέρα από όλα αυτά, υπάρχει ένα ζήτημα που εξακολουθεί να απαιτεί πολύ περισσότερη προσοχή: Το κόστος λειτουργίας αυτών των μεγάλων μοντέλων στην παραγωγή (κόστος εξαγωγής συμπερασμάτων) αποτελεί σημαντική απειλή για την καινοτομία. Τα παραγωγικά μοντέλα είναι εξαιρετικά μεγάλα, πολύπλοκα και υπολογιστικά απαιτητικά, καθιστώντας την εκτέλεσή τους πολύ πιο δαπανηρή από άλλα είδη μοντέλων μηχανικής μάθησης.

Φανταστείτε ότι δημιουργείτε μια εφαρμογή διακόσμησης σπιτιού που βοηθά τους πελάτες να φανταστούν το δωμάτιό τους σε διαφορετικά στυλ σχεδιασμού. Με κάποια λεπτή ρύθμιση, το μοντέλο Stable Diffusion μπορεί να το κάνει αυτό σχετικά εύκολα. Καταλήγετε σε μια υπηρεσία που χρεώνει 1,50 δολάρια για 1.000 εικόνες, το οποίο μπορεί να μην ακούγεται πολύ, αλλά τι θα συμβεί αν η εφαρμογή γίνει viral; Ας υποθέσουμε ότι έχετε 1 εκατομμύριο ενεργούς καθημερινούς χρήστες που φτιάχνουν δέκα εικόνες ο καθένας. Το κόστος συμπερασμού σας είναι τώρα 5,4 εκατομμύρια δολάρια ετησίως.

Το κόστος LLM: Η εξαγωγή συμπερασμάτων είναι μόνιμη

Τώρα, σε περίπτωση που χρησιμοποιείτε ένα παραγωγικό μοντέλο ή ένα LLM ως τη βασική δομή της εφαρμογής σας, ολόκληρη η δομή τιμολόγησης, το σχέδιο ανάπτυξης και το επιχειρηματικό σας μοντέλο πρέπει να λαμβάνουν υπόψη αυτά τα κόστη. Μέχρι τη στιγμή που η εφαρμογή τεχνητής νοημοσύνης σας θα ξεκινήσει, η εκπαίδευση είναι λίγο πολύ ένα κόστος που έχει βυθιστεί, αλλά η εξαγωγή συμπερασμάτων είναι για πάντα.

Υπάρχουν πολλά παραδείγματα εταιρειών που τρέχουν αυτά τα μοντέλα και θα γίνεται όλο και πιο δύσκολο γι' αυτές να διατηρήσουν αυτά τα κόστη μακροπρόθεσμα.

Αλλά ενώ τα ιδιόκτητα μοντέλα έχουν κάνει μεγάλα βήματα προόδου σε σύντομο χρονικό διάστημα, δεν είναι η μόνη επιλογή. Τα μοντέλα ανοικτού κώδικα παρουσιάζουν επίσης μεγάλες υποσχέσεις όσον αφορά την ευελιξία, τις επιδόσεις και την εξοικονόμηση κόστους - και θα μπορούσαν να αποτελέσουν μια βιώσιμη επιλογή για πολλές αναδυόμενες εταιρείες που κινούνται προς τα εμπρός.

Υβριδικός κόσμος: Ανοιχτού κώδικα και ιδιόκτητα μοντέλα είναι σημαντικά

Δεν υπάρχει αμφιβολία ότι έχουμε φτάσει από το μηδέν στο 60 σε σύντομο χρονικό διάστημα με τα ιδιόκτητα μοντέλα. Μόλις τους τελευταίους μήνες, είδαμε την OpenAI και τη Microsoft να λανσάρουν το GPT-4, το Bing Chat και ατελείωτα plugins. Η Google παρενέβη επίσης με την εισαγωγή του Bard. Η πρόοδος στο διάστημα είναι εντυπωσιακή.

Ωστόσο, σε αντίθεση με τη δημοφιλή πεποίθηση, δεν πιστεύω ότι η γενική τεχνητή νοημοσύνη είναι ένα παιχνίδι "ο νικητής τα παίρνει όλα". Στην πραγματικότητα, αυτά τα μοντέλα, αν και καινοτόμα, μόλις και μετά βίας αγγίζουν την επιφάνεια των δυνατοτήτων. Και η πιο ενδιαφέρουσα καινοτομία δεν έχει έρθει ακόμα και θα είναι ανοιχτού κώδικα. Ακριβώς όπως έχουμε δει στον κόσμο του λογισμικού, έχουμε φτάσει σε ένα σημείο όπου οι εταιρείες ακολουθούν μια υβριδική προσέγγιση, χρησιμοποιώντας ιδιόκτητα μοντέλα και μοντέλα ανοιχτού κώδικα όπου αυτό έχει νόημα.

Υπάρχουν ήδη αποδείξεις ότι ο ανοιχτός κώδικας θα διαδραματίσει σημαντικό ρόλο στην εξάπλωση της γενικής τεχνητής νοημοσύνης. Υπάρχει το νέο LLaMA 2 της Meta, το τελευταίο και καλύτερο. Στη συνέχεια, υπάρχει το LLaMA, ένα ισχυρό αλλά μικρό μοντέλο που μπορεί να επανεκπαιδευτεί για ένα μέτριο ποσό (περίπου 80.000 δολάρια) και να συντονιστεί με οδηγίες για περίπου 600 δολάρια. Μπορείτε να εκτελέσετε αυτό το μοντέλο οπουδήποτε, ακόμη και σε ένα Macbook Pro, smartphone ή Raspberry Pi.

Εν τω μεταξύ, η Cerebras έχει παρουσιάσει μια οικογένεια μοντέλων και η Databricks έχει κυκλοφορήσει το Dolly, ένα μοντέλο ανοιχτού κώδικα τύπου ChatGPT που είναι επίσης ευέλικτο και φθηνό για εκπαίδευση.

Μοντέλα, κόστος και η δύναμη του ανοικτού κώδικα

Ο λόγος για τον οποίο αρχίζουμε να βλέπουμε μοντέλα ανοιχτού κώδικα να απογειώνονται είναι η ευελιξία τους.Μπορείτε ουσιαστικά να τα τρέξετε σε οποιοδήποτε υλικό με τα κατάλληλα εργαλεία. Δεν έχετε αυτό το επίπεδο ευελιξίας και ελέγχου με τα κλειστά ιδιοκτησιακά μοντέλα.

Και όλα αυτά συνέβησαν σε σύντομο χρονικό διάστημα και είναι μόνο η αρχή.

Έχουμε πάρει σπουδαία μαθήματα από την κοινότητα λογισμικού ανοικτού κώδικα. Αν κάνουμε τα μοντέλα ΤΝ ανοιχτά προσβάσιμα, μπορούμε να προωθήσουμε καλύτερα την καινοτομία. Μπορούμε να προωθήσουμε μια παγκόσμια κοινότητα προγραμματιστών, ερευνητών και καινοτόμων που θα συνεισφέρουν, θα βελτιώσουν και θα προσαρμόσουν τα μοντέλα για το γενικότερο καλό.

Αν μπορέσουμε να το επιτύχουμε αυτό, οι προγραμματιστές θα έχουν την επιλογή να τρέξουν το μοντέλο που ταιριάζει στις συγκεκριμένες ανάγκες τους - είτε πρόκειται για μοντέλο ανοικτού κώδικα είτε για έτοιμο ή προσαρμοσμένο. Σε αυτόν τον κόσμο, οι δυνατότητες είναι πραγματικά ατελείωτες.

Πηγή: How to leverage large language models without breaking the bank

Πώς να αξιοποιήσετε μεγάλα γλωσσικά μοντέλα χωρίς να καταστρέψετε την τράπεζα

Newsletter