Το τελευταίο μοντέλο AI της Meta είναι δωρεάν για όλους

21/08/2023 | | |

Περίληψη άρθρου:
Η εταιρεία Meta αποκαλύπτει το LLaMA 2, το πρώτο μεγάλο γλωσσικό μοντέλο AI της που είναι διαθέσιμο δωρεάν για χρήση από οποιονδήποτε. Η εταιρεία ελπίζει ότι αυτή η κίνηση μπορεί να την βοηθήσει να ανταγωνιστεί την OpenAI. Το LLaMA 2 είναι μέρος μιας σουίτας μοντέλων τεχνητής νοημοσύνης που περιλαμβάνει εκδόσεις του LLaMA 2 σε διαφορετικά μεγέθη. Η Meta ελπίζει ότι η απελευθέρωση και η διάθεση του μοντέλου θα τη βοηθήσουν να ανακτήσει το χαμένο έδαφος. Ωστόσο, υπάρχουν ακόμα επιφυλάξεις καθώς η Meta δεν παρέχει πληροφορίες σχετικά με το σύνολο των δεδομένων που χρησιμοποίησε για την εκπαίδευση του μοντέλου και το LLaMA 2 εξακολουθεί να παράγει προβληματική γλώσσα όπως όλα τα μεγάλα γλωσσικά μοντέλα. Παρά ταύτα, η Meta ελπίζει ότι η διάθεση του μοντέλου ανοιχτού κώδικα θα τη βοηθήσει να βελτιώσει την ασφάλεια και την αποτελεσματικότητα των μοντέλων της.

Κύρια σημεία του άρθρου:

Meta Απελευθερώνει το LLAMA 2, το πρώτο μεγάλο γλωσσικό μοντέλο AI διαθέσιμο δωρεάν για να χρησιμοποιήσει οποιονδήποτε.
Η κίνηση στοχεύει στον ανταγωνισμό με το OpenAI και στην ανάκτηση του χαμένου εδάφους.
Το LLAMA 2 είναι μέρος μιας σουίτας μοντέλων AI και έρχεται σε διαφορετικά μεγέθη.
Το Llama 2 εξακολουθεί να παράγει προβληματική γλώσσα όπως άλλα μεγάλα γλωσσικά μοντέλα.
Ωστόσο, ο Meta παραδέχεται ότι εξακολουθεί να υπάρχει ένα χάσμα απόδοσης μεταξύ του LLAMA 2 και του GPT-4 της OpenAI.
Η δέσμευση της META για διαφάνεια επιτρέπει στους ερευνητές να μελετήσουν την προκατάληψη, την ηθική και την αποτελεσματικότητα των μοντέλων AI.

Αναλυτικά το άρθρο:
Η Meta τα δίνει όλα για την τεχνητή νοημοσύνη ανοιχτού κώδικα. Η εταιρεία αποκαλύπτει σήμερα το LLaMA 2, το πρώτο μεγάλο γλωσσικό μοντέλο της που είναι διαθέσιμο για χρήση από οποιονδήποτε - δωρεάν.

Από τότε που η OpenAI κυκλοφόρησε το εξαιρετικά δημοφιλές AI chatbot ChatGPT τον περασμένο Νοέμβριο, οι εταιρείες τεχνολογίας τρέχουν να κυκλοφορήσουν μοντέλα με την ελπίδα να ανατρέψουν την υπεροχή της. Η Meta βρίσκεται στην αργή λωρίδα. Τον Φεβρουάριο, όταν οι ανταγωνιστές της Microsoft και της Google ανακοίνωσαν τα AI chatbots τους, η Meta κυκλοφόρησε την πρώτη, μικρότερη έκδοση του LLaMA, η οποία ήταν περιορισμένη στους ερευνητές. Ελπίζει όμως ότι η απελευθέρωση του LLaMA 2 και η δωρεάν διάθεση του σε οποιονδήποτε για την κατασκευή εμπορικών προϊόντων πάνω σε αυτό, θα τη βοηθήσει να καλύψει το χαμένο έδαφος.

Η εταιρεία κυκλοφορεί στην πραγματικότητα μια σουίτα μοντέλων τεχνητής νοημοσύνης, η οποία περιλαμβάνει εκδόσεις του LLaMA 2 σε διαφορετικά μεγέθη, καθώς και μια έκδοση του μοντέλου τεχνητής νοημοσύνης που οι άνθρωποι μπορούν να ενσωματώσουν σε ένα chatbot, παρόμοιο με το ChatGPT. Σε αντίθεση με το ChatGPT, στο οποίο οι άνθρωποι μπορούν να έχουν πρόσβαση μέσω του ιστότοπου της OpenAI, το μοντέλο πρέπει να μεταφορτωθεί από τους συνεργάτες της Meta για το λανσάρισμα της Microsoft Azure, της Amazon Web Services και της Hugging Face.

"Αυτό ωφελεί ολόκληρη την κοινότητα της τεχνητής νοημοσύνης και δίνει επιλογές στους ανθρώπους να επιλέξουν προσεγγίσεις κλειστού ή ανοιχτού κώδικα για ό,τι ταιριάζει στη συγκεκριμένη εφαρμογή τους", λέει ο Ahmad Al-Dahle, αντιπρόεδρος της Meta που ηγείται των εργασιών της εταιρείας για τη γεννητική τεχνητή νοημοσύνη. "Αυτή είναι μια πραγματικά πολύ μεγάλη στιγμή για εμάς".

Αλλά πολλές επιφυλάξεις παραμένουν ακόμη. Η Meta δεν δημοσιεύει πληροφορίες σχετικά με το σύνολο δεδομένων που χρησιμοποίησε για την εκπαίδευση του LLaMA 2 και δεν μπορεί να εγγυηθεί ότι δεν περιελάμβανε έργα που προστατεύονται από πνευματικά δικαιώματα ή προσωπικά δεδομένα, σύμφωνα με ένα ερευνητικό έγγραφο της εταιρείας που μοιράστηκε αποκλειστικά με το MIT Technology Review. Το LLaMA 2 έχει επίσης τα ίδια προβλήματα που ταλαιπωρούν όλα τα μεγάλα γλωσσικά μοντέλα: την τάση να παράγει ψεύδη και προσβλητική γλώσσα.

Η ιδέα, λέει ο Al-Dahle, είναι ότι με την απελευθέρωση του μοντέλου στη φύση και αφήνοντας τους προγραμματιστές και τις εταιρείες να το πειράξουν, η Meta θα πάρει σημαντικά μαθήματα για το πώς να κάνει τα μοντέλα της πιο ασφαλή, λιγότερο προκατειλημμένα και πιο αποτελεσματικά.

Ένα ισχυρό μοντέλο ανοιχτού κώδικα όπως το LLaMA 2 αποτελεί σημαντική απειλή για το OpenAI, λέει ο Percy Liang, διευθυντής του Κέντρου Έρευνας για τα Ιδρυματικά Μοντέλα του Στάνφορντ. Ο Liang ήταν μέλος της ομάδας ερευνητών που ανέπτυξε το Alpaca, έναν ανταγωνιστή ανοικτού κώδικα του GPT-3, μιας προηγούμενης έκδοσης του γλωσσικού μοντέλου του OpenAI.

"Το LLaMA 2 δεν είναι το GPT-4", λέει ο Liang. Και στο ερευνητικό της έγγραφο, η Meta παραδέχεται ότι εξακολουθεί να υπάρχει μεγάλο χάσμα στην απόδοση μεταξύ του LLaMA 2 και του GPT-4, το οποίο είναι πλέον το κορυφαίο γλωσσικό μοντέλο τεχνητής νοημοσύνης του OpenAI. "Αλλά για πολλές περιπτώσεις χρήσης, δεν χρειάζεστε το GPT-4", προσθέτει.

Ένα πιο προσαρμόσιμο και διαφανές μοντέλο, όπως το LLaMA 2, μπορεί να βοηθήσει τις εταιρείες να δημιουργήσουν προϊόντα και υπηρεσίες πιο γρήγορα από ένα μεγάλο, εξελιγμένο ιδιόκτητο μοντέλο, λέει.

"Το να γίνει το LLaMA 2 η κορυφαία εναλλακτική λύση ανοιχτού κώδικα στο OpenAI θα ήταν μια τεράστια νίκη για τη Meta", λέει ο Steve Weber, καθηγητής στο Πανεπιστήμιο της Καλιφόρνιας στο Μπέρκλεϊ.

Κάτω από την κουκούλα

Για να είναι έτοιμο το LLaMA 2 να κυκλοφορήσει, χρειάστηκαν πολλές βελτιώσεις ώστε το μοντέλο να γίνει ασφαλέστερο και λιγότερο πιθανό να εκτοξεύσει τοξικά ψεύδη από τον προκάτοχό του, λέει ο Al-Dahle.

Το Meta έχει πολλές παλιές γκάφες για να μάθει από αυτές. Το γλωσσικό της μοντέλο για την επιστήμη, το Galactica, τέθηκε εκτός λειτουργίας μετά από μόλις τρεις ημέρες, και το προηγούμενο μοντέλο LLaMA, το οποίο προοριζόταν μόνο για ερευνητικούς σκοπούς, διέρρευσε στο διαδίκτυο, προκαλώντας επικρίσεις από πολιτικούς που αμφισβήτησαν αν η Meta λαμβάνει δεόντως υπόψη τους κινδύνους που συνδέονται με τα γλωσσικά μοντέλα τεχνητής νοημοσύνης, όπως η παραπληροφόρηση και η παρενόχληση.

Για να μετριάσει τον κίνδυνο επανάληψης αυτών των λαθών, η Meta εφάρμοσε ένα μείγμα διαφορετικών τεχνικών μηχανικής μάθησης με στόχο τη βελτίωση της εξυπηρετικότητας και της ασφάλειας.

Η προσέγγιση της Meta για την εκπαίδευση του LLaMA 2 είχε περισσότερα βήματα από τα συνηθισμένα για τα παραγωγικά μοντέλα ΤΝ, λέει η Sasha Luccioni, ερευνήτρια στην νεοφυή εταιρεία ΤΝ Hugging Face.

Το μοντέλο εκπαιδεύτηκε σε 40% περισσότερα δεδομένα από τον προκάτοχό του. Ο Al-Dahle λέει ότι υπήρχαν δύο πηγές δεδομένων εκπαίδευσης: δεδομένα που είχαν ανακτηθεί από το διαδίκτυο και ένα σύνολο δεδομένων που τελειοποιήθηκε και βελτιώθηκε σύμφωνα με την ανατροφοδότηση από ανθρώπινους σχολιαστές ώστε να συμπεριφέρεται με έναν πιο επιθυμητό τρόπο. Η εταιρεία λέει ότι δεν χρησιμοποίησε δεδομένα χρηστών Meta στο LLaMA 2 και απέκλεισε δεδομένα από ιστότοπους που γνώριζε ότι είχαν πολλές προσωπικές πληροφορίες.

Παρά ταύτα, το LLaMA 2 εξακολουθεί να εκτοξεύει προσβλητική, επιβλαβή και άλλως προβληματική γλώσσα, όπως ακριβώς και τα ανταγωνιστικά μοντέλα. Η Meta λέει ότι δεν αφαίρεσε τα τοξικά δεδομένα από το σύνολο δεδομένων, επειδή η παραμονή τους θα μπορούσε να βοηθήσει το LLaMA 2 να ανιχνεύσει καλύτερα τη ρητορική μίσους, ενώ η αφαίρεσή τους θα μπορούσε να προκαλέσει τον κίνδυνο να φιλτραριστούν κατά λάθος ορισμένες δημογραφικές ομάδες.

Παρ' όλα αυτά, η δέσμευση της Meta για διαφάνεια είναι συναρπαστική, λέει η Luccioni, επειδή επιτρέπει σε ερευνητές όπως η ίδια να μελετήσουν σωστά τις προκαταλήψεις, την ηθική και την αποτελεσματικότητα των μοντέλων τεχνητής νοημοσύνης.

Το γεγονός ότι το LLaMA 2 είναι ένα μοντέλο ανοικτού κώδικα θα επιτρέψει επίσης σε εξωτερικούς ερευνητές και προγραμματιστές να το εξετάσουν για ελαττώματα ασφαλείας, γεγονός που θα το καταστήσει ασφαλέστερο από τα ιδιόκτητα μοντέλα.

Πηγή: Meta’s latest AI model is free for all

Το τελευταίο μοντέλο AI της Meta είναι δωρεάν για όλους

Newsletter