Το GPT-5.4 της OpenAI ξεπερνά ανθρώπους σε εργασίες υπολογιστή και γνώσης

11/03/2026 | | |

Περίληψη

Η OpenAI παρουσίασε το GPT-5.4, το νέο κορυφαίο της μοντέλο AI με σημαντικές βελτιώσεις σε εργασίες υπολογιστή, λογική, προγραμματισμό, μαθηματικά και επιστήμη. Το μοντέλο επιτυγχάνει επιδόσεις υψηλότερες από ανθρώπους σε ορισμένα benchmarks και μπορεί να χειρίζεται σύνθετες εργασίες μεγάλης διάρκειας με έως και 1 εκατομμύριο tokens context.

Κύρια σημεία

Η OpenAI κυκλοφόρησε το GPT-5.4, διαθέσιμο ως GPT-5.4 Thinking για χρήστες Plus, Team και Pro.
Στο benchmark OSWorld-V για πραγματική χρήση desktop, πέτυχε 75%, ξεπερνώντας το ανθρώπινο baseline (72,4%).
Η επίδοση είναι περίπου διπλάσια από το GPT-5.2 στο ίδιο τεστ.
Υποστηρίζει έως 1 εκατομμύριο tokens context, επιτρέποντας μακροχρόνια και πολύπλοκα tasks.
Περιλαμβάνει νέο επίπεδο υψηλής λογικής επεξεργασίας, ώστε agents να σχεδιάζουν και να εκτελούν εργασίες που διαρκούν ώρες.
Στο benchmark GDPval για 44 επαγγέλματα γνώσης, ισοφάρισε ή ξεπέρασε επαγγελματίες στο 83% των περιπτώσεων (από 71% στο GPT-5.2).
Ερευνητές της OpenAI δήλωσαν ότι δεν βλέπουν κάποιο άμεσο «όριο» στην πρόοδο της AI.

Αναλυτικά

Η OpenAI ανακοίνωσε το GPT-5.4, το πιο προηγμένο μοντέλο της μέχρι σήμερα, το οποίο φέρνει σημαντικές βελτιώσεις στις δυνατότητες τεχνητής νοημοσύνης σε τομείς όπως η πλοήγηση σε υπολογιστές, ο προγραμματισμός, η επιστημονική ανάλυση, τα μαθηματικά και η σύνθετη λογική. Το μοντέλο κυκλοφόρησε μόλις δύο ημέρες μετά την έκδοση 5.3 Instant και είναι διαθέσιμο σε χρήστες με συνδρομή Plus, Team και Pro.

Σε benchmark που αξιολογεί πραγματικές εργασίες σε περιβάλλον desktop, το GPT-5.4 πέτυχε βαθμολογία 75%, ξεπερνώντας τη μέση ανθρώπινη επίδοση. Παράλληλα, παρουσίασε μεγάλη βελτίωση σε σχέση με προηγούμενες εκδόσεις, δείχνοντας σημαντική πρόοδο στην ικανότητα εκτέλεσης πρακτικών εργασιών στον υπολογιστή.

Ένα από τα πιο σημαντικά νέα χαρακτηριστικά είναι η δυνατότητα επεξεργασίας έως και ενός εκατομμυρίου tokens context, επιτρέποντας στο σύστημα να διαχειρίζεται τεράστιες ποσότητες πληροφοριών και να εκτελεί σύνθετες εργασίες που μπορεί να διαρκούν αρκετές ώρες. Επιπλέον, η νέα λειτουργία αυξημένης λογικής επεξεργασίας επιτρέπει σε AI agents να σχεδιάζουν και να ολοκληρώνουν πιο περίπλοκες διαδικασίες.

Σε ένα benchmark που αξιολογεί εργασίες γνώσης σε 44 επαγγέλματα, το GPT-5.4 ισοφάρισε ή ξεπέρασε επαγγελματίες στο 83% των περιπτώσεων, ποσοστό σημαντικά υψηλότερο από προηγούμενες εκδόσεις του μοντέλου. Η ανακοίνωση έρχεται σε μια περίοδο έντονου ανταγωνισμού στον χώρο της AI, με την εταιρεία να παρουσιάζει την έκδοση αυτή ως σημαντικό βήμα προόδου στην εξέλιξη των δυνατοτήτων των μοντέλων τεχνητής νοημοσύνης.

Το GPT-5.4 της OpenAI ξεπερνά ανθρώπους σε εργασίες υπολογιστή και γνώσης

Newsletter