7 Οκτωβρίου 2024

Μια νέα ομάδα προσπαθεί να κάνει την αδειοδότηση δεδομένων Τεχνητής Νοημοσύνης ηθική

Περίληψη του άρθρου:

Η Συμμαχία Παροχής Δεδομένων (DPA) παροτρύνει τους δημιουργούς και τους κατόχους δικαιωμάτων να συναινούν στη χρήση των υλικών τους για εκπαιδευτικούς σκοπούς. Καθώς αυξάνονται οι περιορισμοί πρόσβασης δεδομένων, εμφανίζονται νέες εκκινήσεις αδειοδότησης για να εξασφαλιστεί μια σταθερή ροή πηγών. Η DPA υποστηρίζει ένα σύστημα opt-in, σε αντίθεση με τα επικρατούντα μοντέλα εξαίρεσης που χρησιμοποιούνται από σημαντικές εταιρείες AI, υπογραμμίζοντας την ανάγκη για ηθική δέσμευση από τους δημιουργούς. Η Συμμαχία αποτελείται από επτά επιχειρήσεις αδειοδότησης και προτείνει ποικίλες δομές αποζημίωσης, συμπεριλαμβανομένων μοντέλων που βασίζονται σε συνδρομές και με βάση τη χρήση. Η DPA υποστηρίζει επίσης τις κατάλληλες πρακτικές αδειοδότησης για συνθετικά δεδομένα, ζητώντας διαφάνεια και τακτικές αξιολογήσεις μοντέλων AI. Παρά τις προκλήσεις της αποδοχής της βιομηχανίας, η DPA υποδηλώνει τη μετατόπιση των δεοντολογικών προτύπων στην αδειοδότηση AI.



Κύρια σημεία του άρθρου:

  • Οι υποστηρικτές της Αρχής Προστασίας Δεδομένων (DPA) για τους δημιουργούς και τους κατόχους δικαιωμάτων  χορηγούν ρητή συγκατάθεση για τη χρήση του υλικού τους σε εκπαιδευτικά πλαίσια.
  • Η πρόσβαση στα δεδομένα κατάρτισης γίνεται όλο και πιο περιορισμένη, οδηγώντας σε αυξημένες συμφωνίες αδειοδότησης και την εμφάνιση νέων επιχειρήσεων αδειοδότησης.
  • Η DPA στοχεύει στην τυποποίηση και τη δημιουργία δικαιοσύνης στο πλαίσιο της βιομηχανίας τεχνητής νοημοσύνης (AI), έχοντας κυκλοφορήσει ένα έγγραφο θέσης που ασχολείται με βασικά ζητήματα που σχετίζονται με τα δεδομένα κατάρτισης (TN).
  • Η συμμαχία περιλαμβάνει επτά εταιρείες αδειοδότησης, συμπεριλαμβανομένης της εταιρείας διαχείρισης πνευματικών δικαιωμάτων μουσικής Rightsify και Pixta, με σχέδια για πέντε ακόμη μέλη μέχρι το φθινόπωρο.
  • Η DPA υποστηρίζει ένα σύστημα opt-in για τη χρήση δεδομένων, σε αντίθεση με πολλές εταιρείες AI που χρησιμοποιούν συστήματα εξαίρεσης ή δεν παρέχουν καθόλου επιλογή opt-out.
  •  Ο Διευθύνων Σύμβουλος Alex Bestall υπογραμμίζει ότι η προσέγγιση opt-in είναι τόσο ηθική όσο και πρακτική, υποστηρίζοντας ότι η πώληση δεδομένων που είναι διαθέσιμα στο κοινό δεν έχει αξιοπιστία.

Αναλυτικά το άρθρο:

Η Συμμαχία Παροχής Δεδομένων (Dataset Providers Alliance) ζητά να μπορούν οι δημιουργοί και οι κάτοχοι δικαιωμάτων να επιλέγουν να χρησιμοποιείται το υλικό τους για εκπαιδευτικούς σκοπούς. Το πρώτο κύμα των μεγάλων εργαλείων δημιουργικής τεχνητής νοημοσύνης εκπαιδεύτηκε σε μεγάλο βαθμό με «δημόσια διαθέσιμα» δεδομένα - βασικά, με οτιδήποτε μπορούσε να αντληθεί από το διαδίκτυο.

Τώρα, οι πηγές δεδομένων εκπαίδευσης περιορίζουν όλο και περισσότερο την πρόσβαση και πιέζουν για συμφωνίες αδειοδότησης. Με το κυνήγι για πρόσθετες πηγές δεδομένων να εντείνεται, νέες startups που ασχολούνται με την αδειοδότηση έχουν εμφανιστεί για να διατηρήσουν τη ροή του πηγαίου υλικού.

Η Dataset Providers Alliance, μια εμπορική ομάδα που σχηματίστηκε αυτό το καλοκαίρι, θέλει να κάνει τη βιομηχανία της τεχνητής νοημοσύνης πιο τυποποιημένη και δίκαιη. Για τον σκοπό αυτό, μόλις κυκλοφόρησε ένα έγγραφο θέσεων που περιγράφει τις θέσεις της σε σημαντικά ζητήματα που σχετίζονται με την ΤΝ.

Η συμμαχία αποτελείται από επτά εταιρείες αδειοδότησης ΤΝ, συμπεριλαμβανομένης της εταιρείας διαχείρισης μουσικών πνευματικών δικαιωμάτων Rightsify, της ιαπωνικής αγοράς φωτογραφιών Pixta και της νεοφυούς εταιρείας αδειοδότησης πνευματικών δικαιωμάτων γεννητικής ΤΝ Calliope Networks. (Τουλάχιστον πέντε νέα μέλη θα ανακοινωθούν το φθινόπωρο).

Η DPA τάσσεται υπέρ ενός συστήματος opt-in, που σημαίνει ότι τα δεδομένα μπορούν να χρησιμοποιηθούν μόνο μετά από ρητή συγκατάθεση των δημιουργών και των κατόχων δικαιωμάτων. Αυτό αποτελεί σημαντική απόκλιση από τον τρόπο με τον οποίο λειτουργούν οι περισσότερες μεγάλες εταιρείες τεχνητής νοημοσύνης.
Ορισμένες έχουν αναπτύξει τα δικά τους συστήματα opt-out, τα οποία ρίχνουν το βάρος στους κατόχους δεδομένων να αποσύρουν το έργο τους κατά περίπτωση. Άλλες δεν προσφέρουν καθόλου opt-out. η DPA, η οποία αναμένει από τα μέλη της να τηρούν τον κανόνα της opt-in, θεωρεί αυτή την οδό ως την πολύ πιο ηθική.

 «Οι καλλιτέχνες και οι δημιουργοί θα πρέπει να συμφωνήσουν», λέει ο Alex Bestall, διευθύνων σύμβουλος της Rightsify και της εταιρείας αδειοδότησης μουσικών δεδομένων Global Copyright Exchange, ο οποίος ηγήθηκε της προσπάθειας.

 Ο Bestall βλέπει την επιλογή «opt-in» ως μια ρεαλιστική προσέγγιση, καθώς και ως μια ηθική προσέγγιση: «Η πώληση δημοσίως διαθέσιμων συνόλων δεδομένων είναι ένας τρόπος για να σε μηνύσουν και να μην έχεις καμία αξιοπιστία».

Ο Ed Newton-Rex, πρώην στέλεχος της ΤΝ, ο οποίος τώρα διευθύνει τη μη κερδοσκοπική οργάνωση Fairly Trained για την ηθική ΤΝ, αποκαλεί τη δυνατότητα εξαίρεσης «θεμελιωδώς άδικη για τους δημιουργούς», προσθέτοντας ότι ορισμένοι μπορεί να μην γνωρίζουν καν πότε προσφέρεται η δυνατότητα εξαίρεσης. «Είναι ιδιαίτερα καλό να βλέπουμε την DPA να ζητά opt-ins», λέει.

Ο Shayne Longpre, επικεφαλής της Data Provenance Initiative, μιας εθελοντικής συλλογικότητας που ελέγχει σύνολα δεδομένων τεχνητής νοημοσύνης, θεωρεί τις προσπάθειες της DPA για ηθική πηγή δεδομένων αξιοθαύμαστες, αν και υποψιάζεται ότι το πρότυπο opt-in θα μπορούσε να είναι δύσκολο να πωληθεί, λόγω του τεράστιου όγκου δεδομένων που απαιτούν τα περισσότερα σύγχρονα μοντέλα τεχνητής νοημοσύνης.

«Υπό αυτό το καθεστώς, είτε θα πεινάσετε για δεδομένα είτε θα πληρώσετε πολλά», λέει. «Θα μπορούσε να είναι ότι μόνο λίγοι παίκτες, μεγάλες εταιρείες τεχνολογίας, μπορούν να αντέξουν οικονομικά να αδειοδοτήσουν όλα αυτά τα δεδομένα».

Στο έγγραφο, η DPA τάσσεται κατά της αδειοδότησης που επιβάλλει η κυβέρνηση, υποστηρίζοντας αντ' αυτού μια προσέγγιση της «ελεύθερης αγοράς», κατά την οποία οι δημιουργοί δεδομένων και οι εταιρείες ΤΝ διαπραγματεύονται απευθείας. Άλλες κατευθυντήριες γραμμές είναι πιο λεπτομερείς.

Για παράδειγμα, η συμμαχία προτείνει πέντε πιθανές δομές αποζημίωσης για να διασφαλιστεί ότι οι δημιουργοί και οι κάτοχοι δικαιωμάτων πληρώνονται κατάλληλα για τα δεδομένα τους.

Αυτές περιλαμβάνουν ένα μοντέλο με βάση τη συνδρομή, την «αδειοδότηση με βάση τη χρήση» (όπου τα τέλη καταβάλλονται ανά χρήση) και την αδειοδότηση με βάση το αποτέλεσμα, όπου τα δικαιώματα συνδέονται με το κέρδος. «Αυτά θα μπορούσαν να λειτουργήσουν για οτιδήποτε, από τη μουσική μέχρι τις εικόνες, τον κινηματογράφο και την τηλεόραση ή τα βιβλία», λέει ο Bestall.

«Η προσπάθεια τυποποίησης των δομών αποζημίωσης είναι ενδεχομένως καλό πράγμα», λέει ο Bill Rosenblatt, τεχνολόγος που μελετά τα πνευματικά δικαιώματα.
 «Η Dataset Providers Alliance είναι σε πολύ καλή θέση να θέσει όρους». Όπως το βλέπει ο Rosenblatt, οι εταιρείες τεχνητής νοημοσύνης χρειάζονται κίνητρα για να υιοθετήσουν την αδειοδότηση.

 Ενώ οι νομικοί λόγοι (φόβος για αγωγές, κανονισμοί που επιβάλλουν άδειες) είναι οι πιο προφανώς επιτακτικοί, ο Rosenblatt λέει ότι είναι επίσης σημαντικό για τους επίδοξους αδειοδότες να κάνουν τη διαδικασία όσο το δυνατόν πιο εύκολη και βολική. Η τυποποίηση των μοντέλων πληρωμών, υποστηρίζει, βοηθά στην εξομάλυνση του δρόμου για την υιοθέτηση της γενικής χρήσης.

Η DPA εγκρίνει επίσης ορισμένες χρήσεις συνθετικών δεδομένων -αυτών που παράγονται από την ΤΝ- υποστηρίζοντας ότι θα «αποτελούν την πλειονότητα» των δεδομένων εκπαίδευσης στο εγγύς μέλλον. «Σε ορισμένους κατόχους πνευματικών δικαιωμάτων μάλλον δεν θα αρέσει», λέει ο Bestall. «Αλλά είναι αναπόφευκτο».

 Η συμμαχία τάσσεται υπέρ της «κατάλληλης αδειοδότησης» των πληροφοριών προ-εκπαίδευσης που χρησιμοποιούνται για τη δημιουργία συνθετικών δεδομένων και της διαφάνειας σχετικά με τον τρόπο παραγωγής των τελευταίων. Ζητά επίσης την τακτική «αξιολόγηση» των μοντέλων συνθετικών δεδομένων για τον «μετριασμό των προκαταλήψεων και των δεοντολογικών ζητημάτων.»

Φυσικά, η DPA πρέπει να πείσει τους ισχυρούς παράγοντες της βιομηχανίας να συμφωνήσουν, πράγμα που είναι ευκολότερο να ειπωθεί παρά να γίνει. «Αναδύονται πρότυπα για το πώς να αδειοδοτούμε δεδομένα με ηθικό τρόπο», λέει ο Newton-Rex. «Αλλά δεν τα υιοθετούν αρκετές εταιρείες τεχνητής νοημοσύνης».
Παρόλα αυτά, η ίδια η ύπαρξη της DPA αποδεικνύει ότι οι μέρες της Άγριας Δύσης της τεχνητής νοημοσύνης φαίνεται να φτάνουν στο τέλος τους. «Τα πάντα αλλάζουν τόσο γρήγορα», λέει ο Bestall.

Πηγή: A New Group Is Trying to Make AI Data Licensing Ethical