23 Απριλίου 2026

Το νέο μοντέλο της Stability AI είναι ελαφρώς καλύτερο στη δημιουργία χεριών

Περίληψη άρθρου:
Η Stability AI κυκλοφόρησε μια νέα έκδοση του Stable Diffusion, ενός συστήματος τεχνητής νοημοσύνης που ανταγωνίζεται το DALL-E 2 της OpenAI. Αυτή η νέα έκδοση, που ονομάζεται Stable Diffusion XL (SDXL), είναι διαθέσιμη σε beta και φέρνει έναν "πλούτο" στη δημιουργία εικόνων που δεν είχε το παλιό μοντέλο. Είναι καλύτερο στη δημιουργία κειμένου, στη σύνθεση εικόνων και στη δημιουργία προσώπων και δεν απαιτεί μακροσκελείς, λεπτομερείς οδηγίες για τη δημιουργία περιγραφικών εικόνων. Διαθέτει επίσης λειτουργίες που επεκτείνονται πέρα από την προτροπή από κείμενο σε εικόνα, συμπεριλαμβανομένης της προτροπής από εικόνα σε εικόνα, της ζωγραφικής και της εξωτερικής ζωγραφικής. Ωστόσο, έχει υποβληθεί σε νομικές προκλήσεις λόγω των περιορισμών χρήσης του και της χρήσης εικόνων που προέρχονται από το διαδίκτυο και προστατεύονται από πνευματικά δικαιώματα. Η Stability AI έχει δεσμευτεί να σέβεται τα αιτήματα των καλλιτεχνών για την αφαίρεση της τέχνης τους από το σύνολο δεδομένων εκπαίδευσης, αλλά αυτό δεν ισχύει για το SDXL. Η εταιρεία δέχεται πιέσεις για την αξιοποίηση των προσπαθειών της στον τομέα της Τεχνητής Νοημοσύνης και έχει αφήσει να εννοηθεί ότι σχεδιάζει την εισαγωγή της στο χρηματιστήριο.


Αναλυτικά το άρθρο:
Η Stability AI, η νεοφυής επιχείρηση που χρηματοδοτεί μια σειρά πειραμάτων γεννητικής τεχνητής νοημοσύνης, κυκλοφόρησε μια νέα έκδοση του Stable Diffusion, του συστήματος τεχνητής νοημοσύνης από κείμενο σε εικόνα που ήταν από τα πρώτα που ανταγωνίστηκαν το DALL-E 2 της OpenAI.

Με την ονομασία Stable Diffusion XL ή SDXL, το νέο σύστημα - το οποίο είναι διαθέσιμο σε beta έκδοση μέσω του DreamStudio, του εργαλείου γεννητικής τέχνης της Stability AI - βελτιώνει το πρωτότυπο με βασικούς τρόπους. Ο Tom Mason, CTO της Stability AI, λέει ότι φέρνει έναν "πλούτο" στη δημιουργία εικόνων που έλειπε από το παλιό μοντέλο (Stable Diffusion 2.1), με τις βελτιώσεις να είναι πιο αξιοσημείωτες σε εφαρμογές όπως ο γραφικός σχεδιασμός και η αρχιτεκτονική.

"Είμαστε ενθουσιασμένοι που ανακοινώνουμε την τελευταία επανάληψη της σειράς Stable Diffusion των λύσεων εικόνας", ανέφερε σε μια ανακοίνωση που δόθηκε σε κονσέρβα. "[Είναι] μετασχηματιστική σε διάφορους κλάδους ... με τα αποτελέσματα να λαμβάνουν χώρα μπροστά στα μάτια μας". Αφήνοντας στην άκρη τις υπερβολές, το SDXL φαίνεται όντως ισάξιο -και ίσως και καλύτερο- με την τελευταία έκδοση του μοντέλου της Midjourney, του μοντέλου που ευθύνεται για το "Balenciaga Pope" (μεταξύ άλλων memes).

Ενώ η προηγούμενη έκδοση του Stable Diffusion και πολλά άλλα συστήματα μετατροπής κειμένου σε εικόνα δυσκολεύονται σθεναρά να αναπαραστήσουν ορισμένη ανατομία, όπως τα χέρια, το SDXL δεν έχει τέτοιο πρόβλημα. Τα χέρια δεν είναι πάντα... καλά, ρεαλιστικά. Αλλά είναι μίλια μπροστά από τα εφιαλτικά καύσιμα που συχνά παρήγαγε ο προκάτοχος του SDXL.

Το SDXL υποτίθεται ότι είναι καλύτερο και στη δημιουργία κειμένου, μια εργασία που ιστορικά έφερνε τα μοντέλα γεννητικής τέχνης AI σε δύσκολη θέση. Αλλά έχει ακόμα δρόμο μπροστά του, αν η σύντομη δοκιμή μου αποτελεί ένδειξη. Σε ένα δελτίο τύπου, η Stability AI ισχυρίζεται επίσης ότι το SDXL διαθέτει "βελτιωμένη σύνθεση εικόνων και δημιουργία προσώπων" και δεν απαιτεί μακροσκελείς, λεπτομερείς οδηγίες για τη δημιουργία "περιγραφικών εικόνων", σε αντίθεση με τον προκάτοχό του.

Επιπλέον, το SDXL διαθέτει λειτουργικότητα που εκτείνεται πέρα από την απλή προτροπή από κείμενο σε εικόνα, συμπεριλαμβανομένης της προτροπής από εικόνα σε εικόνα (εισαγωγή μιας εικόνας για να λάβετε παραλλαγές αυτής της εικόνας), της ζωγραφικής (ανακατασκευή των τμημάτων που λείπουν από μια εικόνα) και της ζωγραφικής (κατασκευή μιας απρόσκοπτης επέκτασης μιας υπάρχουσας εικόνας).

Ως μπαλαντέρ, προσπάθησα να αναδημιουργήσω το μιμίδιο Balenciaga Pope με όσο το δυνατόν πιο σύντομη προτροπή: "Balenciaga Pope". Η διαφορά στα αποτελέσματα ήταν πιο έντονη από ό,τι περίμενα, πρέπει να πω, με το SDXL να ποζάρει μοντέλα της πασαρέλας με αυτό που θα μπορούσε να περάσει για επώνυμη ενδυμασία σε σχέση με την ευθέως θρησκευτική ενδυμασία που προκαλούσε η παλιά Stable Diffusion.

Μόλις βγει από τη beta, το SDXL θα είναι ανοιχτού κώδικα, λέει η Stability AI, όπως και οι προηγούμενες εκδόσεις του Stable Diffusion. Εκτός από το DreamStudio, το SDXL είναι επί του παρόντος διαθέσιμο μέσω του API της Stability, επίσης σε πρώιμη πρόσβαση.

Ενώ η τεχνολογία της δημιουργικής τέχνης AI προχωράει, εργαλεία όπως το SDXL έχουν προκαλέσει προβλήματα στις εταιρείες λόγω του τρόπου με τον οποίο έχουν κατασκευαστεί και εμπορευματοποιηθεί. Η Stability AI βρίσκεται στο στόχαστρο μιας νομικής υπόθεσης που ισχυρίζεται ότι η εταιρεία παραβίασε τα δικαιώματα εκατομμυρίων καλλιτεχνών αναπτύσσοντας τα εργαλεία της χρησιμοποιώντας εικόνες από το διαδίκτυο, οι οποίες προστατεύονται από πνευματικά δικαιώματα.

Ο προμηθευτής εικόνων αρχείου Getty Images έχει επίσης προσφύγει στη δικαιοσύνη κατά της Stability AI επειδή φέρεται να χρησιμοποίησε εικόνες από τον ιστότοπό της χωρίς άδεια για τη δημιουργία του αρχικού Stable Diffusion. Η έκδοση ανοιχτού κώδικα του Stable Diffusion έχει επίσης γίνει αντικείμενο διαμάχης, λόγω των σχετικά ελαφρών περιορισμών χρήσης του.

Ορισμένες κοινότητες σε όλο τον ιστό το έχουν αξιοποιήσει για να δημιουργήσουν πορνογραφικά deepfakes διασημοτήτων και γραφικές απεικονίσεις βίας. Μέχρι σήμερα, τουλάχιστον ένας Αμερικανός νομοθέτης έχει ζητήσει τη θέσπιση κανονισμών για την αντιμετώπιση της απελευθέρωσης μοντέλων όπως το Stable Diffusion που "δεν μετριάζουν επαρκώς το περιεχόμενο".

Σε απάντηση στις αγωγές, η Stability AI δεσμεύτηκε πρόσφατα να σεβαστεί τα αιτήματα των καλλιτεχνών να αφαιρέσουν την τέχνη τους από το σύνολο δεδομένων εκπαίδευσης του Stable Diffusion, αλλά αυτό δεν ισχύει για το SDXL - μόνο για τα μοντέλα Stable Diffusion επόμενης γενιάς, με την κωδική ονομασία "Stable Diffusion 3.0". Οι καλλιτέχνες έχουν αφαιρέσει περισσότερα από 78 εκατομμύρια έργα τέχνης από το σύνολο δεδομένων εκπαίδευσης μέχρι σήμερα, σύμφωνα με την Spawning, την οργάνωση που ηγείται της προσπάθειας εξαίρεσης.

Με τις νομικές προκλήσεις να είναι καταδικασμένες, η Stability AI δέχεται πιέσεις για να εκμεταλλευτεί τις εκτεταμένες προσπάθειές της για την τεχνητή νοημοσύνη, οι οποίες καλύπτουν το φάσμα από την τέχνη και την εμψύχωση μέχρι τη βιοϊατρική και τη γεννήτρια ήχου.

Ο διευθύνων σύμβουλος της Stability AI, Emad Mostaque, έχει υπαινιχθεί σχέδια για IPO, αλλά η Semafor ανέφερε πρόσφατα ότι η Stability AI - η οποία συγκέντρωσε πάνω από 100 εκατομμύρια δολάρια σε επιχειρηματικά κεφάλαια τον περασμένο Οκτώβριο σε μια αναφερόμενη αποτίμηση άνω του 1 δισεκατομμυρίου δολαρίων - "καίει μετρητά και αργεί να δημιουργήσει έσοδα".

Πηγή: Stability AI’s new model is slightly better at generating hands