2 Δεκεμβρίου 2024

Η Mistral ανακοινώνει το Codestral, ένα LLM γενιάς κώδικα που λέει ότι ξεπερνά όλους τους άλλους

Περίληψη άρθρου:

Η Mistral, μια εταιρεία AI που βασίζεται στο Παρίσι, εισάγει το Codestral, ένα μοντέλο κώδικα-κεντρικής γλώσσας που ειδικεύεται σε εργασίες κωδικοποίησης σε 80+ γλώσσες προγραμματισμού. Σκοπός του είναι να ενισχύσει την παραγωγικότητα των προγραμματιστών και να μειώσει τα σφάλματα. Το μοντέλο έχει δείξει πολλά υποσχόμενα αποτελέσματα σε διάφορες αξιολογήσεις και δοκιμάζεται από ηγέτες της βιομηχανίας όπως η JetBrains και η SourceGraph. Οι προγραμματιστές μπορούν να έχουν πρόσβαση στο Codestral μέσω του hugging face για μη εμπορική χρήση ή πλατφόρμες API για ευρύτερη έρευνα και ανάπτυξη εφαρμογών. Ωστόσο, η απόδοσή του έναντι άλλων μοντέλων κωδικοποίησης όπως το StarCoder2, το Codex της OpenAI και το Codewhisper του Amazon θα γίνει αντιληπτή μέσω του αυξανόμενου ανταγωνισμού στην αγορά εργαλείων κωδικοποίησης AI.

 

Κύρια σημεία Άρθρου:

  • Η Mistral, μια εταιρεία AI με έδρα το Παρίσι, εισήγαγε το Codestral, ένα μοντέλο με επίκεντρο τον κώδικα που ειδικεύεται σε εργασίες κωδικοποίησης σε πάνω από 80 γλώσσες προγραμματισμού.
  • Βελτίωση της παραγωγικότητας των προγραμματιστών και μείωση των σφαλμάτων.
  • Το Codestral έχει δείξει πολλά υποσχόμενα αποτελέσματα σε διάφορες αξιολογήσεις και δοκιμάζεται από ηγέτες της βιομηχανίας όπως η JetBrains και η SourceGraph.
  • Οι προγραμματιστές μπορούν να έχουν πρόσβαση στο Codestral μέσω του hugging face για μη εμπορική χρήση ή πλατφόρμες API για ευρύτερη έρευνα και ανάπτυξη εφαρμογών.
  • Οι επιδόσεις έναντι άλλων μοντέλων κωδικοποίησης όπως το StarCoder2, το OpenAi Codex και το Amazon Codewhper θα γίνουν αντιληπτές μέσω του αυξανόμενου ανταγωνισμούστην αγορά εργαλείων κωδικοποίησης AI.
  • Η Mistral συγκέντρωσε την μεγαλύτερη οικονομική επένδυση στην Ευρώπη πριν από ένα χρόνο.

 

Αναλυτικά το άρθρο:

Σήμερα, η Mistral με έδρα το Παρίσι, η νεοσύστατη επιχείρηση τεχνητής νοημοσύνης που συγκέντρωσε την μεγαλύτερη οικονομική επένδυση στην Ευρώπη πριν από ένα χρόνο και έκτοτε έχει γίνει ένα ανερχόμενο αστέρι στον παγκόσμιο τομέα της τεχνητής νοημοσύνης, σημείωσε την είσοδό της στον χώρο του προγραμματισμού και της ανάπτυξης με την κυκλοφορία του Codestral, του πρώτου κώδικα-κεντρικού μεγάλου γλωσσικού μοντέλου (LLM).

Διαθέσιμο σήμερα με μη εμπορική άδεια χρήσης, το Codestral είναι ένα ανοικτού βάρους γεννητικό μοντέλο τεχνητής νοημοσύνης με 22Β παραμέτρους, το οποίο ειδικεύεται σε εργασίες κωδικοποίησης, από τη δημιουργία έως την ολοκλήρωσή τους.

Σύμφωνα με την Mistral, το μοντέλο εξειδικεύεται σε περισσότερες από 80 γλώσσες προγραμματισμού, καθιστώντας το ιδανικό εργαλείο για προγραμματιστές λογισμικού που επιθυμούν να σχεδιάσουν προηγμένες εφαρμογές τεχνητής νοημοσύνης.

Η εταιρεία ισχυρίζεται ότι το Codestral ξεπερνά ήδη τα προηγούμενα μοντέλα που έχουν σχεδιαστεί για εργασίες κωδικοποίησης, συμπεριλαμβανομένων των CodeLlama 70B και Deepseek Coder 33B, και χρησιμοποιείται από διάφορους βιομηχανικούς εταίρους, συμπεριλαμβανομένων των JetBrains, SourceGraph και LlamaIndex.

Ένα αποδοτικό μοντέλο για όλα τα θέματα κωδικοποίησης

Στον πυρήνα του, το Codestral 22B έρχεται με μήκος πλαισίου 32K και παρέχει στους προγραμματιστές τη δυνατότητα να γράφουν και να αλληλεπιδρούν με κώδικα σε διάφορα περιβάλλοντα και έργα κωδικοποίησης.

Το μοντέλο έχει εκπαιδευτεί σε ένα σύνολο δεδομένων με περισσότερες από 80 γλώσσες προγραμματισμού, γεγονός που το καθιστά κατάλληλο για ένα ευρύ φάσμα εργασιών κωδικοποίησης, συμπεριλαμβανομένης της δημιουργίας κώδικα από το μηδέν, της ολοκλήρωσης λειτουργιών κωδικοποίησης, της συγγραφής δοκιμών και της ολοκλήρωσης οποιουδήποτε μερικού κώδικα με τη χρήση ενός μηχανισμού συμπλήρωσης του ενδιάμεσου. Οι γλώσσες προγραμματισμού που καλύπτει περιλαμβάνουν δημοφιλείς γλώσσες όπως η SQL, η Python, η Java, η C και η C++, καθώς και πιο ειδικές όπως η Swift και η Fortran.

Η Mistral αναφέρει ότι το Codestral μπορεί να βοηθήσει τους προγραμματιστές να «ανεβάσουν το επίπεδο του προγραμματισμού τους» για να επιταχύνουν τις ροές εργασίας και να εξοικονομήσουν σημαντικό χρόνο και προσπάθεια κατά την κατασκευή εφαρμογών. Για να μην αναφέρουμε ότι μπορεί επίσης να βοηθήσει στη μείωση του κινδύνου σφαλμάτων.

Παρόλο που το μοντέλο μόλις ξεκίνησε και δεν έχει ακόμη δοκιμαστεί δημόσια, η Mistral ισχυρίζεται ότι ήδη ξεπερνά τα υπάρχοντα κωδικοκεντρικά μοντέλα, συμπεριλαμβανομένων των CodeLlama 70B, Deepseek Coder 33B και Llama 3 70B, στις περισσότερες γλώσσες προγραμματισμού.

Στο RepoBench, το οποίο έχει σχεδιαστεί για την αξιολόγηση της συμπλήρωσης κώδικα Python σε επίπεδο αποθετηρίου σε μεγάλη απόσταση, το Codestral ξεπέρασε και τα τρία μοντέλα με ακρίβεια 34%. Ομοίως, στο HumanEval για την αξιολόγηση της δημιουργίας κώδικα Python και στο CruxEval για τον έλεγχο της πρόβλεψης εξόδου Python, το μοντέλο ξεπέρασε τον ανταγωνισμό με βαθμολογίες 81,1% και 51,3%, αντίστοιχα. Ξεπέρασε ακόμη και τα μοντέλα στο HumanEval για Bash, Java και PHP.

Αξίζει να σημειωθεί ότι η απόδοση του μοντέλου στο HumanEval για C++, C και Typescript, δεν ήταν η καλύτερη, αλλά η μέση βαθμολογία σε όλες τις δοκιμές μαζί ήταν η υψηλότερη με 61,5%, ακριβώς μπροστά από το 61,2% του Llama 3 70B. Στην αξιολόγηση Spider για την απόδοση της SQL, ήταν δεύτερο με βαθμολογία 63,5%.

Αρκετά δημοφιλή εργαλεία για την παραγωγικότητα των προγραμματιστών και την ανάπτυξη εφαρμογών AI έχουν ήδη αρχίσει να δοκιμάζουν το Codestral. Σε αυτά περιλαμβάνονται μεγάλα ονόματα όπως τα LlamaIndex, LangChain, Continue.dev, Tabnine και JetBrains.

"Από τις αρχικές μας δοκιμές, είναι μια εξαιρετική επιλογή για τις ροές εργασίας δημιουργίας κώδικα, επειδή είναι γρήγορο, έχει ένα ευνοϊκό παράθυρο περιβάλλοντος και η έκδοση με οδηγίες υποστηρίζει τη χρήση εργαλείων. Δοκιμάσαμε με το LangGraph για αυτοδιορθωτική παραγωγή κώδικα χρησιμοποιώντας τη χρήση εργαλείου instruct Codestral για την έξοδο και λειτούργησε πολύ καλά out-of-the-box", δήλωσε ο Harrison Chase, CEO και συνιδρυτής της LangChain.

Πώς να ξεκινήσετε με το Codestral;

Η Mistral προσφέρει το Codestral 22B στο Hugging Face με τη δική της άδεια μη παραγωγής, η οποία επιτρέπει στους προγραμματιστές να χρησιμοποιούν την τεχνολογία για μη εμπορικούς σκοπούς, δοκιμές και για την υποστήριξη ερευνητικών εργασιών.

Η εταιρεία διαθέτει επίσης το μοντέλο μέσω δύο τελικών σημείων API: codestral.mistral.ai και api.mistral.ai.

Το πρώτο έχει σχεδιαστεί για χρήστες που επιθυμούν να χρησιμοποιήσουν τις διαδρομές Instruct ή Fill-In-the-Middle της Codestral μέσα στο IDE τους. Έρχεται με ένα κλειδί API που διαχειρίζεται σε προσωπικό επίπεδο χωρίς τα συνήθη όρια του ποσοστού του οργανισμού και είναι δωρεάν για χρήση κατά τη διάρκεια μιας περιόδου beta οκτώ εβδομάδων. Εν τω μεταξύ, το τελευταίο είναι το συνηθισμένο τερματικό σημείο για ευρύτερη έρευνα, ομαδικά ερωτήματα ή ανάπτυξη εφαρμογών τρίτων, με τα ερωτήματα να χρεώνονται ανά token.

Περαιτέρω, οι ενδιαφερόμενοι προγραμματιστές μπορούν επίσης να δοκιμάσουν τις δυνατότητες του Codestral συνομιλώντας με μια εκπαιδευμένη έκδοση του μοντέλου στο Le Chat, τη δωρεάν διεπαφή συνομιλίας της Mistral.

Η κίνηση της Mistral να εισαγάγει το Codestral δίνει στους ερευνητές των επιχειρήσεων άλλη μια αξιοσημείωτη επιλογή για την επιτάχυνση της ανάπτυξης λογισμικού, αλλά μένει να δούμε πώς το μοντέλο αποδίδει έναντι άλλων κωδικοκεντρικών μοντέλων στην αγορά, συμπεριλαμβανομένου του πρόσφατα εισαχθέντος StarCoder2 καθώς και των προτάσεων από το OpenAI και την Amazon.

Η πρώτη προσφέρει το Codex, το οποίο τροφοδοτεί την υπηρεσία co-pilot του GitHub, ενώ η δεύτερη διαθέτει το εργαλείο CodeWhisper. Το ChatGPT της OpenAI έχει επίσης χρησιμοποιηθεί από προγραμματιστές ως εργαλείο κωδικοποίησης και το μοντέλο GPT-4 Turbo της εταιρείας τροφοδοτεί το Devin, την υπηρεσία ημιαυτόνομου πράκτορα κωδικοποίησης της Cognition.

Υπάρχει επίσης ισχυρός ανταγωνισμός από την Replit, η οποία διαθέτει μερικά μικρά μοντέλα κωδικοποίησης AI στο Hugging Face και την Codenium, η οποία πρόσφατα απέσπασε χρηματοδότηση 65 εκατομμυρίων δολαρίων της σειράς Β με αποτίμηση 500 εκατομμυρίων δολαρίων.

Πήγη: Mistral announces Codestral, a code-generation LLM it says outperforms all otherss all others