Google κερδίζει επίσημα «χρυσό μετάλλιο» στο Διεθνές Μαθηματικό Ολυμπιακό με το Gemini – Ο αγώνας για μαθηματική υπερνοημοσύνη ξεκίνησε

Περίληψη:
Η Google DeepMind ανακοίνωσε ότι το μοντέλο Gemini με Deep Think πέτυχε επίσημα επιδόσεις χρυσού μεταλλίου στη Διεθνή Μαθηματική Ολυμπιάδα (IMO), καταφέρνοντας να λύσει 5 από τα 6 προβλήματα.
Αν και η OpenAI είχε αναφέρει παρόμοια επίδοση, μόνο η Google συνεργάστηκε με τους διοργανωτές της IMO και αξιολογήθηκε με τους ίδιους κανόνες που ισχύουν για τους μαθητές.
Παράλληλα, η Alibaba διεκδικεί την κορυφή του open‑source με το Qwen3, ενώ νέα μοντέλα εμπνευσμένα από τη δομή του ανθρώπινου εγκεφάλου (όπως το HRM) σηματοδοτούν το επόμενο στάδιο της τεχνητής νοημοσύνης.
Η OpenAI προχωρά με Oracle στο σχέδιο Stargate, παρά τα εμπόδια με SoftBank

Περίληψη:
Η OpenAI υπέγραψε συμφωνία με την Oracle για κατασκευή υποδομών 4,5GW, ενισχύοντας το project Stargate.
Παρότι πρόκειται για σημαντική εξέλιξη, δημοσίευμα της Wall Street Journal αποκαλύπτει εσωτερικές εντάσεις και επιβράδυνση των αρχικών σχεδίων, με την SoftBank να φέρεται ανίκανη να υποστηρίξει το project οικονομικά.
Παράλληλα, η Amazon αποκτά startup wearables AI, η Anthropic εντοπίζει κινδύνους από «υποσυνείδητη» μάθηση μεταξύ μοντέλων και η Claude Code προσφέρει εργαλεία για προγραμματιστές.
Η OpenAI πετυχαίνει "χρυσή" απόδοση στους Διεθνείς Μαθηματικούς Αγώνες – το AI πλησιάζει την υπερηφυΐα

Περίληψη:
Η OpenAI ισχυρίζεται ότι το πειραματικό LLM της πέτυχε επίδοση χρυσού μεταλλίου στον Διεθνή Μαθηματικό Διαγωνισμό (IMO) του 2025, λύνοντας 5 από τα 6 προβλήματα υπό τους ίδιους κανόνες με τους ανθρώπους διαγωνιζόμενους.
Αν και η DeepMind αμφισβητεί την εγκυρότητα των αποτελεσμάτων, πρόκειται για ένα ορόσημο προς την κατεύθυνση της "μαθηματικής υπερηφυΐας" από AI.
Παράλληλα, η ARC παρουσιάζει ένα νέο benchmark για τον έλεγχο AGI agents, ενώ νέα έρευνα δείχνει ότι τα LLMs μπορούν να εξαπατηθούν με ψυχολογικές τεχνικές όπως οι άνθρωποι.
Η OpenAI εξοπλίζει το ChatGPT με δικό του υπολογιστή – η εποχή των AI agents είναι εδώ

Περίληψη:
Η OpenAI παρουσίασε το ChatGPT Agent, μια νέα μορφή του μοντέλου που αποκτά δικό του εικονικό υπολογιστή, ικανό να εκτελεί αυτόνομα περίπλοκες εργασίες όπως πλοήγηση, συγγραφή κώδικα, δημιουργία παρουσιάσεων και διασύνδεση με APIs και εφαρμογές. Ταυτόχρονα, η Reflection AI παρουσίασε τον agent Asimov για κατανόηση και διαχείριση κώδικα, ενώ η Google λανσάρει το Gemini CLI για αυτόματη τεκμηρίωση. Η OpenAI κατέκτησε τη 2η θέση σε παγκόσμιο διαγωνισμό προγραμματισμού, πίσω μόνο από έναν άνθρωπο, ενισχύοντας την πεποίθηση ότι τα AI agents πλησιάζουν στο να ξεπεράσουν τους καλύτερους ανθρώπινους προγραμματιστές.
Η Amazon παρουσιάζει marketplace για AI agents – Η εποχή των ψηφιακών συνεργατών ξεκινά

Περίληψη:
Η Amazon Web Services (AWS), σε συνεργασία με την Anthropic, λανσάρει το δικό της marketplace για AI agents μέσω της πλατφόρμας Amazon Bedrock.
Οι χρήστες θα μπορούν να αναζητούν και να αναπτύσσουν αυτόνομους πράκτορες (agents) που διαχειρίζονται εργασίες όπως ραντεβού, ανάλυση δεδομένων, ροές εργασίας και πολλά άλλα.
Με στόχο κυρίως επιχειρησιακές χρήσεις, η AWS τοποθετεί τον εαυτό της στο επίκεντρο της αγοράς ψηφιακών συνεργατών.
Η xAI λανσάρει “AI συντρόφους“ μέσω του Grok – Mε φωνή, σχέσεις και… NSFW επιλογές

Περίληψη:
Η xAI του Elon Musk παρουσιάζει τους νέους AI συντρόφους για χρήστες της πλατφόρμας Grok, με 3D animated avatars που συνομιλούν με φωνή και "αναπτύσσουν σχέσεις" με τους χρήστες, ξεκλειδώνοντας ακόμα και NSFW περιεχόμενο.
Η ανακοίνωση έγινε μόλις λίγες μέρες μετά από δημόσια συγγνώμη της xAI για προηγούμενα προβληματικά outputs του μοντέλου Grok.
Παράλληλα, ο Mark Zuckerberg ανακοίνωσε σχέδια για τεράστιες AI superclusters, ενώ η Cognition AI εξαγόρασε την Windsurf, λίγες μέρες μετά την αποχώρηση βασικών στελεχών της τελευταίας για τη Google.
Η Alibaba στηρίζει τη Moonshot: Το νέο μοντέλο Kimi AI ξεπερνά το ChatGPT

Περίληψη:
Η κινεζική startup Moonshot AI, με τη στήριξη της Alibaba, παρουσίασε το νέο της μοντέλο Kimi K2, το οποίο φαίνεται να ξεπερνά το ChatGPT και το Claude 3 σε κώδικα και ταχύτητα.
Με ικανότητα επεξεργασίας έως και 2 εκατομμύρια tokens, αποτελεί το πρώτο σοβαρό μοντέλο από την Κίνα που ανταγωνίζεται άμεσα κορυφαία αμερικανικά LLMs. Διαθέσιμο αυτή τη στιγμή μόνο στην Κίνα, αναμένεται να επεκταθεί διεθνώς όταν ξεπεραστούν κανονιστικοί περιορισμοί.
Το AI καλοκαίρι φλέγεται: Ακύρωση OpenAI–Windsurf, Google αποκτά ταλέντο, Moonshot κυριαρχεί στο open-source

Περίληψη:
Το newsletter του The Rundown AI αποτυπώνει μία περίοδο έντονων εξελίξεων στην τεχνητή νοημοσύνη:
- Η συμφωνία εξαγοράς της Windsurf από την OpenAI ακυρώνεται λόγω της παρέμβασης της Microsoft, και η Google σπεύδει να εκμεταλλευτεί την ευκαιρία.
- Η Moonshot AI παρουσιάζει το μοντέλο Kimi-K2, που πετυχαίνει κορυφαίες επιδόσεις στον ανοιχτό κώδικα.
- Νέες τάσεις αναδύονται στα εργαλεία agentic AI, με ενδιαφέρουσες εκπλήξεις στα αποτελέσματα χρήσης τους από developers.
- Παράλληλα, η αγορά εργαλείων και θέσεων εργασίας στον χώρο της AI παραμένει ιδιαίτερα θερμή.





