Η Τεχνητή Νοημοσύνη Ανοιχτού Κώδικα είναι ο δρόμος προς το μέλλον

25/07/2024 | |

Περίληψη Άρθρου:

Στις πρώτες ημέρες της πληροφορικής, οι μεγάλες εταιρείες τεχνολογίας έχτισαν συστήματα UNIX κλειστού κώδικα, αλλά το μοντέλο ανοιχτού κώδικα της Linux κέρδισε το κοινό λόγω της τροποποιησιμότητας και της προσβασιμότητάς του. Σήμερα, το Linux στηρίζει το cloud computing και τις κινητές συσκευές. Ομοίως, η τεχνητή νοημοσύνη (AI) εξελίσσεται προς την πηγή ανοιχτού κώδικα. Τα μοντέλα όπως το LLAMA γίνονται όλο και πιο ανταγωνιστικά. Η τεχνητή νοημοσύνη ανοικτού κώδικα προωθεί την προσαρμογή, τον έλεγχο των δεδομένων, την ασφάλεια και τη σχέση κόστους-αποτελεσματικότητας. Καθώς περισσότερες εταιρείες υιοθετούν το LLAMA για τις ανάγκες τους, θα μπορούσε να γίνει ένα βιομηχανικό πρότυπο που εκδημοκρατίζει την τεχνητή νοημοσύνη παγκοσμίως, εξασφαλίζοντας παράλληλα την ασφάλεια μέσω της διαφάνειας και της εποπτείας της κοινότητας. Ένα ισχυρό ανοιχτό οικοσύστημα AI επιτρέπει την καινοτομία και ενθαρρύνει τη συνεργασία μεταξύ εταιρειών και πανεπιστημίων παγκοσμίως.

Κύρια σημεία του άρθρου:

Το μοντέλο ανοιχτού κώδικα του Linux απέκτησε δημοτικότητα λόγω της τροποποιησιμότητας και της προσβασιμότητάς του.
Σήμερα, το Linux υποστηρίζει cloud computing και κινητές συσκευές.
Η τεχνητή νοημοσύνη εξελίσσεται προς ένα μοντέλο ανοιχτού κώδικα, με ανταγωνιστικά μοντέλα.
Η τεχνητή νοημοσύνη ανοιχτού κώδικα προάγει την προσαρμογή, τον έλεγχο των δεδομένων, την ασφάλεια και την αποδοτικότητα του κόστους.
Η τεχνητή νοημοσύνη ανοιχτού κώδικα εξασφαλίζει την ασφάλεια μέσω της διαφάνειας και της κοινοτικής εποπτείας.
Ένα ισχυρό ανοιχτό οικοσύστημα για την τεχνητή νοημοσύνη ενθαρρύνει την καινοτομία και τη συνεργασία μεταξύ εταιρειών και πανεπιστημίων παγκοσμίως.

Αναλυτικά το άρθρο:

Στις πρώιμες ημέρες των υψηλής απόδοσης υπολογιστών, οι μεγαλύτερες εταιρείες τεχνολογίας της εποχής επένδυσαν σημαντικά στην ανάπτυξη των δικών τους εκδόσεων Unix κλειστού κώδικα.

Εκείνη την εποχή ήταν δύσκολο να φανταστεί κανείς ότι οποιαδήποτε άλλη προσέγγιση θα μπορούσε να αναπτύξει τόσο προηγμένο λογισμικό. Τελικά όμως, το Linux ανοιχτού κώδικα κέρδισε δημοτικότητα - αρχικά επειδή επέτρεπε στους προγραμματιστές να τροποποιούν τον κώδικά του όπως ήθελαν και ήταν πιο προσιτό, και με την πάροδο του χρόνου επειδή έγινε πιο προηγμένο, πιο ασφαλές και είχε ένα ευρύτερο οικοσύστημα που υποστήριζε περισσότερες δυνατότητες από οποιοδήποτε κλειστό Unix. Σήμερα, το Linux αποτελεί το βιομηχανικό πρότυπο θεμέλιο τόσο για το cloud computing όσο και για τα λειτουργικά συστήματα που τρέχουν τις περισσότερες κινητές συσκευές - και όλοι μας επωφελούμαστε από ανώτερα προϊόντα εξαιτίας του.

Πιστεύω ότι η τεχνητή νοημοσύνη θα εξελιχθεί με παρόμοιο τρόπο. Σήμερα, αρκετές εταιρείες τεχνολογίας αναπτύσσουν κορυφαία κλειστά μοντέλα. Αλλά ο ανοιχτός κώδικας καλύπτει γρήγορα το χάσμα. Πέρυσι, το Llama 2 ήταν συγκρίσιμο μόνο με μια παλαιότερη γενιά μοντέλων πίσω από τα σύνορα. Φέτος, το Llama 3 είναι ανταγωνιστικό με τα πιο προηγμένα μοντέλα και προηγείται σε ορισμένους τομείς. Από το επόμενο έτος, αναμένουμε ότι τα μελλοντικά μοντέλα Llama θα γίνουν τα πιο προηγμένα στον κλάδο. Αλλά ακόμη και πριν από αυτό, το Llama είναι ήδη πρωτοπόρο σε θέματα ανοικτού χαρακτήρα, δυνατότητας τροποποίησης και αποδοτικότητας κόστους.

Σήμερα κάνουμε τα επόμενα βήματα για να γίνει η τεχνητή νοημοσύνη ανοιχτού κώδικα το πρότυπο του κλάδου. Κυκλοφορούμε το Llama 3.1 405B, το πρώτο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα σε επίπεδο αιχμής, καθώς και τα νέα και βελτιωμένα μοντέλα Llama 3.1 70B και 8B. Εκτός του ότι έχει σημαντικά καλύτερο κόστος/απόδοση σε σχέση με τα κλειστά μοντέλα, το γεγονός ότι το μοντέλο 405B είναι ανοιχτό θα το καταστήσει την καλύτερη επιλογή για την τελειοποίηση και την απόσταξη μικρότερων μοντέλων.

Πέρα από την κυκλοφορία αυτών των μοντέλων, συνεργαζόμαστε με μια σειρά εταιρειών για την ανάπτυξη του ευρύτερου οικοσυστήματος. Η Amazon, η Databricks και η NVIDIA λανσάρουν πλήρεις πακέτα υπηρεσιών για να υποστηρίξουν τους προγραμματιστές να τελειοποιήσουν και να αποστάξουν τα δικά τους μοντέλα. Καινοτόμοι όπως η Groq έχουν κατασκευάσει υπηρεσίες εξαγωγής συμπερασμάτων χαμηλής καθυστέρησης και χαμηλού κόστους για όλα τα νέα μοντέλα. Τα μοντέλα θα είναι διαθέσιμα σε όλα τα μεγάλα νέφη, συμπεριλαμβανομένων των AWS, Azure, Google, Oracle και άλλων. Εταιρείες όπως η Scale.AI, η Dell, η Deloitte και άλλες είναι έτοιμες να βοηθήσουν τις επιχειρήσεις να υιοθετήσουν το Llama και να εκπαιδεύσουν προσαρμοσμένα μοντέλα με τα δικά τους δεδομένα. Καθώς η κοινότητα μεγαλώνει και περισσότερες εταιρείες αναπτύσσουν νέες υπηρεσίες, μπορούμε συλλογικά να κάνουμε το Llama το βιομηχανικό πρότυπο και να φέρουμε τα οφέλη της τεχνητής νοημοσύνης σε όλους.

Η Meta έχει δεσμευτεί για την τεχνητή νοημοσύνη ανοικτού κώδικα. Θα περιγράψω γιατί πιστεύω ότι ο ανοιχτός κώδικας είναι η καλύτερη αναπτυξιακή δέσμη για εσάς, γιατί η ανοιχτή ανάπτυξη του Llama είναι καλή για τη Meta και γιατί η AI ανοιχτού κώδικα είναι καλή για τον κόσμο και επομένως μια πλατφόρμα που θα υπάρχει μακροπρόθεσμα.

Γιατί η τεχνητή νοημοσύνη ανοικτού κώδικα είναι καλή για τους προγραμματιστές

Όταν μιλάω με προγραμματιστές, διευθύνοντες συμβούλους και κυβερνητικούς αξιωματούχους σε όλο τον κόσμο, συνήθως ακούω διάφορα θέματα:

Πρέπει να εκπαιδεύσουμε, να τελειοποιήσουμε και να διαμορφώσουμε τα δικά μας μοντέλα. Κάθε οργανισμός έχει διαφορετικές ανάγκες που ικανοποιούνται καλύτερα με μοντέλα διαφορετικού μεγέθους που εκπαιδεύονται ή τελειοποιούνται με τα συγκεκριμένα δεδομένα τους. Οι εργασίες επί της συσκευής και οι εργασίες ταξινόμησης απαιτούν μικρά μοντέλα, ενώ οι πιο περίπλοκες εργασίες απαιτούν μεγαλύτερα μοντέλα. Τώρα θα είστε σε θέση να πάρετε τα πιο προηγμένα μοντέλα Llama, να συνεχίσετε την εκπαίδευσή τους με τα δικά σας δεδομένα και στη συνέχεια να τα μειώσετε σε ένα μοντέλο του βέλτιστου μεγέθους σας - χωρίς εμείς ή οποιοσδήποτε άλλος να βλέπει τα δεδομένα σας.

Πρέπει να ελέγχουμε τη μοίρα μας και να μην εγκλωβιστούμε σε έναν κλειστό προμηθευτή. Πολλοί οργανισμοί δεν θέλουν να εξαρτώνται από μοντέλα που δεν μπορούν να τρέξουν και να ελέγξουν οι ίδιοι. Δεν θέλουν οι πάροχοι κλειστών μοντέλων να μπορούν να αλλάξουν το μοντέλο τους, να τροποποιήσουν τους όρους χρήσης τους ή ακόμη και να σταματήσουν εντελώς να τους εξυπηρετούν. Επίσης, δεν θέλουν να εγκλωβιστούν σε ένα μόνο cloud που έχει αποκλειστικά δικαιώματα σε ένα μοντέλο. Ο ανοιχτός κώδικας επιτρέπει ένα ευρύ οικοσύστημα εταιρειών με συμβατές αλυσίδες εργαλείων μεταξύ των οποίων μπορείτε να μετακινηθείτε εύκολα.

Πρέπει να προστατεύσουμε τα δεδομένα μας. Πολλοί οργανισμοί χειρίζονται ευαίσθητα δεδομένα που πρέπει να διασφαλίσουν και δεν μπορούν να τα στείλουν σε κλειστά μοντέλα μέσω APIs cloud. Άλλοι οργανισμοί απλώς δεν εμπιστεύονται τα δεδομένα τους στους παρόχους κλειστών μοντέλων. Ο ανοιχτός κώδικας αντιμετωπίζει αυτά τα ζητήματα, δίνοντάς σας τη δυνατότητα να εκτελείτε τα μοντέλα όπου θέλετε. Είναι κοινώς αποδεκτό ότι το λογισμικό ανοικτού κώδικα τείνει να είναι πιο ασφαλές επειδή αναπτύσσεται με μεγαλύτερη διαφάνεια.

Χρειαζόμαστε ένα μοντέλο που να είναι αποτελεσματικό και προσιτό στη λειτουργία του. Οι προγραμματιστές μπορούν να εκτελούν συμπερασμούς στο Llama 3.1 405B στις δικές τους υποδομές με κόστος περίπου 50% του κόστους χρήσης κλειστών μοντέλων όπως το GPT-4o, τόσο για εργασίες συμπερασμού που απευθύνονται στον χρήστη όσο και για εργασίες συμπερασμού εκτός σύνδεσης.

Θέλουμε να επενδύσουμε στο οικοσύστημα που θα είναι το πρότυπο μακροπρόθεσμα. Πολλοί άνθρωποι βλέπουν ότι ο ανοιχτός κώδικας εξελίσσεται με ταχύτερο ρυθμό από ό,τι τα κλειστά μοντέλα, και θέλουν να χτίσουν τα συστήματά τους στην αρχιτεκτονική που θα τους δώσει το μεγαλύτερο πλεονέκτημα μακροπρόθεσμα.

Γιατί η Τεχνητή Νοημοσύνη Ανοιχτού Κώδικα είναι καλή για τον κόσμο

Πιστεύω ότι ο ανοιχτός κώδικας είναι απαραίτητος για ένα θετικό μέλλον της τεχνητής νοημοσύνης. Η τεχνητή νοημοσύνη έχει περισσότερες δυνατότητες από οποιαδήποτε άλλη σύγχρονη τεχνολογία να αυξήσει την ανθρώπινη παραγωγικότητα, τη δημιουργικότητα και την ποιότητα ζωής - και να επιταχύνει την οικονομική ανάπτυξη, ξεκλειδώνοντας παράλληλα την πρόοδο στην ιατρική και επιστημονική έρευνα. Ο ανοικτός κώδικας θα διασφαλίσει ότι περισσότεροι άνθρωποι σε όλο τον κόσμο θα έχουν πρόσβαση στα οφέλη και τις ευκαιρίες της τεχνητής νοημοσύνης, ότι η εξουσία δεν θα συγκεντρωθεί στα χέρια ενός μικρού αριθμού εταιρειών και ότι η τεχνολογία θα μπορεί να αναπτυχθεί πιο ομοιόμορφα και με ασφάλεια σε ολόκληρη την κοινωνία.

Υπάρχει μια συνεχής συζήτηση σχετικά με την ασφάλεια των μοντέλων τεχνητής νοημοσύνης ανοικτού κώδικα και η άποψή μου είναι ότι η τεχνητή νοημοσύνη ανοικτού κώδικα θα είναι ασφαλέστερη από τις εναλλακτικές λύσεις. Νομίζω ότι οι κυβερνήσεις θα καταλήξουν στο συμπέρασμα ότι είναι προς το συμφέρον τους να υποστηρίξουν τον ανοικτό κώδικα, επειδή θα κάνει τον κόσμο πιο ανθηρό και πιο ασφαλή.

Το δικό μου πλαίσιο για την κατανόηση της ασφάλειας είναι ότι πρέπει να προστατευτούμε από δύο κατηγορίες βλάβης: την ακούσια και την εκούσια. Η ακούσια βλάβη είναι όταν ένα σύστημα τεχνητής νοημοσύνης μπορεί να προκαλέσει βλάβη ακόμη και όταν δεν ήταν πρόθεση αυτών που το διαχειρίζονται να το κάνουν. Για παράδειγμα, τα σύγχρονα μοντέλα τεχνητής νοημοσύνης μπορεί να δίνουν ακούσια κακές συμβουλές για την υγεία. Ή, σε πιο φουτουριστικά σενάρια, κάποιοι ανησυχούν ότι τα μοντέλα μπορεί να αυτοαναπαράγονται ακούσια ή να υπερ-βελτιστοποιούν στόχους εις βάρος της ανθρωπότητας. Σκόπιμη βλάβη είναι όταν ένας κακός δράστης χρησιμοποιεί ένα μοντέλο τεχνητής νοημοσύνης με σκοπό να προκαλέσει βλάβη.

Αξίζει να σημειωθεί ότι η ακούσια βλάβη καλύπτει την πλειονότητα των ανησυχιών που έχουν οι άνθρωποι γύρω από την τεχνητή νοημοσύνη - από την επιρροή που θα έχουν τα συστήματα τεχνητής νοημοσύνης στα δισεκατομμύρια των ανθρώπων που θα τα χρησιμοποιούν μέχρι τα περισσότερα από τα πραγματικά καταστροφικά σενάρια επιστημονικής φαντασίας για την ανθρωπότητα. Σε αυτό το μέτωπο, ο ανοιχτός κώδικας θα πρέπει να είναι σημαντικά ασφαλέστερος, δεδομένου ότι τα συστήματα είναι πιο διαφανή και μπορούν να ελεγχθούν ευρέως. Ιστορικά, το λογισμικό ανοικτού κώδικα ήταν πιο ασφαλές για τον λόγο αυτό. Ομοίως, η χρήση του Llama με τα συστήματα ασφαλείας του, όπως το Llama Guard, θα είναι πιθανότατα ασφαλέστερη και ασφαλέστερη από τα κλειστά μοντέλα. Για το λόγο αυτό, οι περισσότερες συζητήσεις γύρω από την ασφάλεια της τεχνητής νοημοσύνης ανοικτού κώδικα επικεντρώνονται στην εκούσια βλάβη.

Η διαδικασία ασφαλείας μας περιλαμβάνει αυστηρές δοκιμές και κόκκινη συνεργασία για να αξιολογήσουμε αν τα μοντέλα μας είναι ικανά να προκαλέσουν ουσιαστική βλάβη, με στόχο τον μετριασμό των κινδύνων πριν από την κυκλοφορία. Δεδομένου ότι τα μοντέλα είναι ανοικτά, ο καθένας είναι σε θέση να κάνει δοκιμές και για τον εαυτό του. Πρέπει να έχουμε κατά νου ότι αυτά τα μοντέλα εκπαιδεύονται από πληροφορίες που υπάρχουν ήδη στο διαδίκτυο, οπότε το σημείο εκκίνησης κατά την εξέταση της βλάβης θα πρέπει να είναι κατά πόσον ένα μοντέλο μπορεί να διευκολύνει μεγαλύτερη βλάβη από τις πληροφορίες που μπορούν να ανακτηθούν γρήγορα από το Google ή άλλα αποτελέσματα αναζήτησης.

Όταν σκεφτόμαστε για σκόπιμη βλάβη, είναι χρήσιμο να διακρίνουμε μεταξύ του τι μπορούν να κάνουν μεμονωμένοι ή μικρής κλίμακας φορείς σε αντίθεση με το τι μπορούν να κάνουν φορείς μεγάλης κλίμακας, όπως τα εθνικά κράτη με τεράστιους πόρους.

Κάποια στιγμή στο μέλλον, μεμονωμένοι κακοί παράγοντες μπορεί να είναι σε θέση να χρησιμοποιήσουν τη νοημοσύνη των μοντέλων τεχνητής νοημοσύνης για να κατασκευάσουν εντελώς νέες βλάβες από τις πληροφορίες που είναι διαθέσιμες στο διαδίκτυο. Σε αυτό το σημείο, η ισορροπία δυνάμεων θα είναι κρίσιμη για την ασφάλεια της τεχνητής νοημοσύνης. Νομίζω ότι θα είναι καλύτερο να ζούμε σε έναν κόσμο όπου η τεχνητή νοημοσύνη αναπτύσσεται ευρέως, ώστε οι μεγαλύτεροι φορείς να μπορούν να ελέγχουν τη δύναμη των μικρότερων κακών φορέων. Με αυτόν τον τρόπο έχουμε διαχειριστεί την ασφάλεια στα κοινωνικά μας δίκτυα - τα πιο ισχυρά μας συστήματα τεχνητής νοημοσύνης εντοπίζουν και σταματούν τις απειλές από λιγότερο εξελιγμένους δρώντες που συχνά χρησιμοποιούν μικρότερης κλίμακας συστήματα τεχνητής νοημοσύνης. Γενικότερα, οι μεγαλύτεροι θεσμοί που αναπτύσσουν τεχνητή νοημοσύνη σε κλίμακα θα προωθήσουν την ασφάλεια και τη σταθερότητα σε ολόκληρη την κοινωνία. Εφόσον όλοι έχουν πρόσβαση σε παρόμοιες γενιές μοντέλων - κάτι που προωθεί ο ανοιχτός κώδικας - τότε οι κυβερνήσεις και τα ιδρύματα με περισσότερους υπολογιστικούς πόρους θα μπορούν να ελέγχουν τους κακούς φορείς με λιγότερους υπολογιστές.

Το επόμενο ερώτημα είναι πώς οι ΗΠΑ και τα δημοκρατικά έθνη θα πρέπει να χειριστούν την απειλή κρατών με τεράστιους πόρους όπως η Κίνα. Το πλεονέκτημα των Ηνωμένων Πολιτειών είναι η αποκεντρωμένη και ανοικτή καινοτομία. Ορισμένοι υποστηρίζουν ότι πρέπει να κλείσουμε τα μοντέλα μας για να εμποδίσουμε την Κίνα να αποκτήσει πρόσβαση σε αυτά, αλλά η άποψή μου είναι ότι αυτό δεν θα λειτουργήσει και θα μειονεκτεί μόνο στις ΗΠΑ και τους συμμάχους τους. Οι αντίπαλοί μας είναι σπουδαίοι στην κατασκοπεία, η κλοπή μοντέλων που χωράνε σε ένα στικάκι είναι σχετικά εύκολη, και οι περισσότερες εταιρείες τεχνολογίας απέχουν πολύ από το να λειτουργούν με τρόπο που θα το καθιστούσε αυτό πιο δύσκολο. Φαίνεται πιο πιθανό ότι ένας κόσμος μόνο με κλειστά μοντέλα έχει ως αποτέλεσμα ένας μικρός αριθμός μεγάλων εταιρειών συν τους γεωπολιτικούς μας αντιπάλους να έχουν πρόσβαση σε κορυφαία μοντέλα, ενώ οι νεοσύστατες επιχειρήσεις, τα πανεπιστήμια και οι μικρές επιχειρήσεις χάνουν ευκαιρίες. Επιπλέον, ο περιορισμός της αμερικανικής καινοτομίας στην κλειστή ανάπτυξη αυξάνει την πιθανότητα να μην ηγηθούμε καθόλου. Αντ' αυτού, πιστεύω ότι η καλύτερη στρατηγική μας είναι να οικοδομήσουμε ένα ισχυρό ανοικτό οικοσύστημα και οι κορυφαίες εταιρείες μας να συνεργάζονται στενά με την κυβέρνησή μας και τους συμμάχους μας, ώστε να διασφαλίσουμε ότι μπορούν να επωφεληθούν με τον καλύτερο δυνατό τρόπο από τις τελευταίες εξελίξεις και να επιτύχουν ένα βιώσιμο πλεονέκτημα πρωτοπόρου μακροπρόθεσμα.

Όταν εξετάζετε τις ευκαιρίες που σας περιμένουν, θυμηθείτε ότι οι περισσότερες από τις σημερινές κορυφαίες εταιρείες τεχνολογίας και επιστημονικής έρευνας βασίζονται σε λογισμικό ανοικτού κώδικα. Η επόμενη γενιά εταιρειών και ερευνών θα χρησιμοποιεί τεχνητή νοημοσύνη ανοιχτού κώδικα, αν επενδύσουμε συλλογικά σε αυτήν. Αυτό περιλαμβάνει τις νεοσύστατες επιχειρήσεις που μόλις ξεκινούν, καθώς και ανθρώπους σε πανεπιστήμια και χώρες που μπορεί να μην έχουν τους πόρους για να αναπτύξουν τη δική τους υπερσύγχρονη τεχνητή νοημοσύνη από το μηδέν.

Το συμπέρασμα είναι ότι η τεχνητή νοημοσύνη ανοικτού κώδικα αποτελεί την ιδανική ευκαιρία για την αξιοποίηση αυτής της τεχνολογίας ώστε να δημιουργηθούν οι μεγαλύτερες οικονομικές ευκαιρίες και η μεγαλύτερη ασφάλεια για όλους.

Ας το χτίσουμε αυτό μαζί

Με τα προηγούμενα μοντέλα Llama, η Meta τα ανέπτυξε για τον εαυτό της και στη συνέχεια τα κυκλοφόρησε, αλλά δεν επικεντρώθηκε ιδιαίτερα στην οικοδόμηση ενός ευρύτερου οικοσυστήματος. Με αυτή την έκδοση ακολουθούμε μια διαφορετική προσέγγιση. Δημιουργούμε ομάδες εσωτερικά για να δώσουμε τη δυνατότητα σε όσο το δυνατόν περισσότερους προγραμματιστές και συνεργάτες να χρησιμοποιήσουν το Llama, και χτίζουμε ενεργά συνεργασίες, ώστε περισσότερες εταιρείες του οικοσυστήματος να μπορούν να προσφέρουν μοναδικές λειτουργίες και στους πελάτες τους.

Πιστεύω ότι η έκδοση του Llama 3.1 θα αποτελέσει σημείο καμπής στον κλάδο όπου οι περισσότεροι προγραμματιστές θα αρχίσουν να χρησιμοποιούν κατά κύριο λόγο ανοιχτό κώδικα, και αναμένω ότι αυτή η προσέγγιση θα αυξηθεί μόνο από εδώ και πέρα. Ελπίζω να μας ακολουθήσετε σε αυτό το ταξίδι για να φέρουμε τα οφέλη της τεχνητής νοημοσύνης σε όλους στον κόσμο.

Πηγή: Open Source AI Is the Path Forward