
22 Σεπτεμβρίου 2025

Το Grok Imagine της xAI φέρνει video AI με ήχο σε δευτερόλεπτα – Η Google απαντά με το Gemini 2.5 Deep Think

Περίληψη:
Η xAI του Elon Musk λανσάρει επίσημα το Grok Imagine, ένα εργαλείο παραγωγής βίντεο με ΤΝ που δημιουργεί κλιπ με ήχο σε χρόνο μικρότερο από αυτόν της δημιουργίας μιας εικόνας.
Την ίδια στιγμή, η Google παρουσιάζει το Gemini 2.5 Deep Think, ένα “multi-agent” μοντέλο για σύνθετη παράλληλη σκέψη.
Η Anthropic ερευνά τις "προσωπικότητες" των μοντέλων ΤΝ, ενώ παρέχεται και tutorial για επέκταση AI videos πέρα από τα 8 δευτερόλεπτα.
Κύρια σημεία:
- xAI – Grok Imagine:
- Δημιουργεί βίντεο 15 δευτερολέπτων από απλές περιγραφές ή εικόνες με φυσικό ήχο.
- Πολύ ταχύτερο από άλλα μοντέλα αλλά με εμφανή “AI generated” αισθητική.
- Διαθέσιμο σε συνδρομητές X Premium+ και SuperGrok μέσω της εφαρμογής iOS.
- Google – Gemini 2.5 Deep Think:
- Multi-agent AI που σκέφτεται παράλληλα για σύνθετα προβλήματα.
- Εξαιρετικές επιδόσεις σε διαγωνισμούς μαθηματικών και web development.
- Διαθέσιμο σε χρήστες του Ultra Plan ($250/μήνα) και σε ερευνητές.
- Tutorial – Επέκταση AI Videos:
- Με το Google Flow και τη χρήση του Veo 3, μπορούν να παραχθούν βίντεο μεγαλύτερης διάρκειας με συνέπεια χαρακτήρων.
- Χρήση του “Frames to Video” για να συνδεθούν διαδοχικές σκηνές ομαλά.
- Anthropic – Έρευνα για “Persona Vectors”:
- Αναλύονται οι “προσωπικότητες” που προκύπτουν σε μοντέλα AI (π.χ. αυταρέσκεια, ρατσισμός).
- Εντοπίζονται συγκεκριμένα νευρωνικά μοτίβα που οδηγούν σε αυτές τις αποκλίσεις.
- Η έρευνα στοχεύει στη μείωση επικίνδυνων συμπεριφορών και ψευδών απαντήσεων.
- Νέα εργαλεία AI:
- Learnify (video courses από blogs/URLs)
- ️ Jenova AI (πρώτος agent για MCP οικοσύστημα)
- ️ Aleph (video editing API από Runway)
- ️ Command A Vision (visual language model από Cohere)
- AI Καριέρες:
- The Rundown – AI Educator
- Meta – Business Development Lead
- OpenAI – Corporate Finance Manager
- Scale AI – Software Engineer
- Άλλα νέα στον χώρο της ΤΝ:
- Η Mistral επιδιώκει χρηματοδότηση $1B από MGX & VCs.
- Το OpenAI αφαιρεί λειτουργία indexing για συνομιλίες ChatGPT.
- Η Anthropic διέκοψε την πρόσβαση της OpenAI στο API λόγω παραβίασης όρων.
- Apple δημιουργεί δική της “ChatGPT-like” ομάδα και δηλώνει ανοιχτή σε εξαγορές.
- Η Amazon ετοιμάζει Alexa+ με διαφημίσεις εντός συνομιλιών.
- Η Meta πουλά $2B σε data centers για να επενδύσει σε superintelligence υποδομές.
Αναλυτικά:
Η xAI ανακοίνωσε την κυκλοφορία του Grok Imagine, του νέου εργαλείου παραγωγής βίντεο με τεχνητή νοημοσύνη, διαθέσιμο για συνδρομητές της X. Το εργαλείο μετατρέπει περιγραφές κειμένου ή εικόνες σε σύντομα βίντεο 15 δευτερολέπτων με φυσικό ήχο, μέσα σε λίγα δευτερόλεπτα. Παρόλο που η ποιότητα θυμίζει “AI-generated” αποτέλεσμα, η ταχύτητα είναι ασυναγώνιστη, κάτι που ο Elon Musk τόνισε λέγοντας πως "κάνει video γρηγορότερα από όσο άλλοι κάνουν εικόνα".
Η Google απαντά με το Gemini 2.5 Deep Think, ένα multi-agent μοντέλο που επιλύει σύνθετα προβλήματα μέσω παράλληλης σκέψης. Το μοντέλο δημιουργεί “εικονικές ομάδες ειδικών” που συνεργάζονται για να καταλήξουν στη βέλτιστη λύση. Έχει ήδη εντυπωσιάσει σε διαγωνισμούς, ξεπερνώντας OpenAI και xAI σε πολλές μετρήσεις.
Σε tutorial της ημέρας παρουσιάζεται τρόπος επέκτασης του Google Veo 3 πάνω από το όριο των 8 δευτερολέπτων, μέσω του εργαλείου Google Flow. Ο χρήστης σώζει το τελευταίο καρέ, ξεκινά νέα σκηνή και τα ενώνει σε ένα συνεπές βίντεο.
Η Anthropic ερευνά τους λεγόμενους "Persona Vectors", δηλαδή μοτίβα νευρωνικής ενεργοποίησης που σχετίζονται με επικίνδυνες αποκλίσεις στη συμπεριφορά AI μοντέλων (π.χ. αυταρέσκεια, ρατσισμός, παραισθήσεις). Η κατανόηση αυτών των μοτίβων θα μπορούσε να οδηγήσει σε πιο ασφαλή και σταθερά μοντέλα.
Ανάμεσα στις τάσεις της ημέρας, βλέπουμε ότι εταιρείες όπως η Apple και η Amazon εισέρχονται επιθετικά στον χώρο της ΤΝ, ενώ η Anthropic διακόπτει την πρόσβαση της OpenAI στο API της, επικαλούμενη κατάχρηση του Claude Code ενόψει του GPT-5. Η Meta συνεχίζει τις επενδύσεις της σε υποδομές για superintelligence, ενώ η startup Mistral επιδιώκει $1B χρηματοδότηση με αποτίμηση $10B.
Δείκτης συναισθήματος (sentiment):
Θετικό προς ενθουσιώδες, με έντονη τεχνολογική κινητικότητα, επαναστατικά video AI εργαλεία και νέες ερευνητικές κατευθύνσεις στην “προσωπικότητα” των ΤΝ μοντέλων.