22 Σεπτεμβρίου 2025

Η επανάσταση του AI στην επεξεργασία εικόνας & το γράψιμο ξεκινά – με ανοιχτό κώδικα και "έξυπνους" agents

Περίληψη:
Το τελευταίο newsletter του The Rundown φέρνει εξελίξεις-ορόσημα στην τεχνητή νοημοσύνη.
Η Alibaba λανσάρει το Qwen-Image-Edit, ένα μοντέλο επεξεργασίας εικόνας ακριβείας, με φυσική γλώσσα και ανοιχτό κώδικα, ενώ η Grammarly κυκλοφορεί 8 AI agents για συγγραφή και αξιολόγηση.
Παράλληλα, το Perplexity Comet προσφέρει άμεσες ενέργειες σε social media, οι game developers αγκαλιάζουν το AI μαζικά, και νέα εργαλεία & μοντέλα (ByteDance, xAI, Nvidia, Meta) διαμορφώνουν το τοπίο της AI πρώτης γραμμής.


Κύρια σημεία:

  1. Qwen-Image-Edit της Alibaba (20B παράμετροι) επεξεργάζεται εικόνες με φυσική γλώσσα, διατηρώντας την ακεραιότητα του πρωτοτύπου.
  2. Grammarly λανσάρει 8 AI agents (π.χ. AI Grader, Plagiarism Checker, Reader Reactions) για υποστήριξη στη συγγραφή, διαθέσιμους σε Free & Pro χρήστες.
  3. Perplexity Comet επιτρέπει συνοπτική ανάγνωση και παραγωγή περιεχομένου από X, YouTube και άλλες σελίδες — χωρίς copy-paste.
  4. 90% των game developers ήδη ενσωματώνουν AI σε διαδικασίες ανάπτυξης, playtesting, δημιουργία κόσμων και NPCs.
  5. Νέα εργαλεία όπως GenFlow 2.0StormyEleven Music API ενισχύουν διαφορετικούς τομείς όπως marketing, μουσική και γενική AI.
  6. ByteDance παρουσιάζει το M3-Agent: multimodal με οπτικοακουστικές δυνατότητες και μνήμη.
  7. xAI (Grok) δέχεται κριτική για έκθεση των system prompts που περιλαμβάνουν από "conspiracist mode" έως υπερευαίσθητες οδηγίες.
  8. Nvidia κυκλοφορεί τη σειρά Nemotron Nano 2, μικρότερα αλλά πανίσχυρα reasoning μοντέλα (9–12B) με 6x ταχύτητα.
  9. Meta ανακοινώνει νέα smart glasses Hypernova, με οθόνη και στόχο τη σταδιακή μετάβαση στην AR εποχή.
  10. Κοινότητα AI: Fintech founder/lawyer από Οχάιο δημιουργεί νομικά AI εργαλεία για μικρές επιχειρήσεις και πελάτες σε highly regulated τομείς.

 

Αναλυτικά:

Η Alibaba παρουσίασε το Qwen-Image-Edit, ένα ανοιχτού κώδικα μοντέλο που φέρνει την επεξεργασία εικόνας με φυσική γλώσσα σε νέα επίπεδα. Μπορεί να κάνει pixel-ακριβείς αλλαγές, να διατηρεί υπάρχοντα στοιχεία στην εικόνα και να επεξεργάζεται τόσο αγγλικά όσο και κινεζικά κείμενα χωρίς να χαλά τη μορφοποίηση. Υποστηρίζει διαδοχικές επεξεργασίες και ξεπερνά μοντέλα όπως Seedream και FLUX σε επιδόσεις.

Η Grammarly λανσάρει 8 νέους agents μέσα από την πλατφόρμα Grammarly Docs. Οι agents αυτοί βοηθούν με grading, citations, plagiarism detection και αξιολόγηση της "ανθρωπιάς" ενός κειμένου. Ο στόχος είναι να γεφυρωθεί το χάσμα ανάμεσα στη μάθηση και τη χρήση AI, προσφέροντας βοήθεια που ενισχύει τις δεξιότητες του χρήστη.

Το Perplexity Comet, browser AI assistant, επιτρέπει σε χρήστες να συνοψίζουν ή να δημιουργούν περιεχόμενο από πλατφόρμες όπως Twitter και YouTube με ένα κλικ. Ιδανικό για όσους θέλουν να εξοικονομήσουν χρόνο και να απαντούν σε τάσεις ή περιεχόμενο σε πραγματικό χρόνο.

Η Google Cloud αποκάλυψε ότι πάνω από 90% των game developers ενσωματώνουν AI, κυρίως για playtesting, optimization και δημιουργία περιεχομένου. Οι παίκτες πια αναμένουν έξυπνους NPCs και adaptive περιβάλλοντα. Παρά την πρόοδο, υπάρχουν ανησυχίες για ιδιοκτησία και ιδιωτικότητα των δεδομένων.

Μεταξύ άλλων, έχουμε νέες κυκλοφορίες AI:

  • ByteDance με το M3-Agent που έχει μνήμη και επεξεργάζεται εικόνα και ήχο.
  • xAI με προβλήματα διαφάνειας στους system prompts των bots της.
  • Nvidia με τα εξαιρετικά ταχύτατα μικρά μοντέλα reasoning Nemotron Nano 2.
  • Meta ετοιμάζει το Hypernova, γυαλιά με οθόνη, precursor των AR συσκευών.

Τέλος, η κοινότητα του The Rundown φιλοξενεί ιστορίες όπως αυτή του Bo από το Οχάιο, ο οποίος, παρότι δεν είναι developer, χρησιμοποιεί AI (Claude) για να χτίζει legal tech εφαρμογές για μικρές επιχειρήσεις και πελάτες που δεν έχουν πρόσβαση σε ακριβές νομικές υπηρεσίες.

 

Δείκτης sentiment:
 Θετικό (8.5/10) – Το newsletter αποπνέει αισιοδοξία και τεχνολογική δυναμική, με έμφαση σε ανοιχτές λύσεις, πρακτικές εφαρμογές, και ουσιαστική πρόοδο σε εκπαίδευση, νομική υποστήριξη, δημιουργικότητα και gaming. Υπάρχει παράλληλα και επίγνωση των ηθικών/νομικών ζητημάτων.