Η άποψη του Andrew Ng

11/01/2024 | | |

Περίληψη άρθρου:

Η New York Times κατέθεσε μήνυση κατά της OpenAI και της Microsoft, κατηγορώντας τους για παραβίαση πνευματικών δικαιωμάτων με τη χρήση εκατομμυρίων άρθρων των NYT για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης τους. Ωστόσο, ο συγγραφέας αυτού του άρθρου υποστηρίζει τη θέση της OpenAI και της Microsoft περισσότερο από τη θέση των NYT. Θεωρούν ότι η αγωγή δεν είναι ξεκάθαρη σχετικά με το τι πραγματικά συνέβη και τη ζημία που προκλήθηκε. Ο συγγραφέας εικάζει ότι τα παραδείγματα των αναμασημένων άρθρων μπορεί να προέρχονται από έναν μηχανισμό όπου το ChatGPT κατέβαζε άρθρα από τον ιστό σε απάντηση σε προτροπές του χρήστη. Πιστεύουν ότι η εκπαίδευση μοντέλων τεχνητής νοημοσύνης θα πρέπει να θεωρείται θεμιτή χρήση, παρόμοια με τους ανθρώπους που διαβάζουν και μαθαίνουν από διαδικτυακά άρθρα. Ο συγγραφέας υποστηρίζει ότι η κατανόηση του κατά πόσον η αναμάσηση προέρχεται από προεκπαιδευμένα βάρη ή από μηχανισμό περιήγησης στον ιστό είναι απαραίτητη. Προτείνουν ότι η πρόληψη της αναμάσησης μέσω της περιήγησης στον ιστό είναι τεχνικά εφικτή. Ο συγγραφέας συγκρίνει επίσης αυτή την κατάσταση με τη χρήση των σημειωματάριων Jupyter ή του YouTube, όπου οι χρήστες μπορούν να κάνουν κατάχρηση των πλατφορμών για παραβίαση πνευματικών δικαιωμάτων, αλλά η ευθύνη ανήκει στους μεμονωμένους χρήστες και όχι στην ίδια την πλατφόρμα. Αναγνωρίζουν τις προσπάθειες του OpenAI για την αντιμετώπιση των ζητημάτων αναμάσησης και εκφράζουν την αισιοδοξία τους ότι καθώς η Γενετική Τεχνητή Νοημοσύνη εξελίσσεται, μπορούν να βρεθούν λύσεις για πιθανά προβλήματα όπως η παραγωγή εικόνων που προστατεύονται από πνευματικά δικαιώματα.

Κύρια σημεία του άρθρου:

Οι New York Times (NYT) κατέθεσαν αγωγή κατά της OpenAI και της Microsoft για παραβίαση πνευματικών δικαιωμάτων.
Η αγωγή υποστηρίζει ότι η OpenAI και η Microsoft χρησιμοποίησαν εκατομμύρια άρθρα των NYT που προστατεύονται από πνευματικά δικαιώματα για να εκπαιδεύσουν τα μοντέλα τους.
Δίνονται παραδείγματα όπου τα μοντέλα της OpenAI αναμασούσαν άρθρα των NYT σχεδόν αυτολεξεί.
Ο συγγραφέας υποστηρίζει τη θέση της OpenAI και της Microsoft περισσότερο από τη θέση των NYT, αλλά πιστεύει ότι η αγωγή δεν είναι ξεκάθαρη σχετικά με το τι πραγματικά συνέβη και τη ζημία που προκλήθηκε.
Η σχέση μεταξύ των σημείων 1 και 2 της αγωγής είναι συγκεχυμένη, αφήνοντας τους σχολιαστές των μέσων κοινωνικής δικτύωσης να αναρωτιούνται πώς η εκπαίδευση στα άρθρα των NYT οδήγησε στην κατά λέξη παραγωγή από το ChatGPT.
Ο συγγραφέας υποψιάζεται ότι τα παραδείγματα των αναμασημένων άρθρων μπορεί να προέρχονται από έναν μηχανισμό όπως το RAG, όπου το ChatGPT περιηγήθηκε στον ιστό για σχετικές πληροφορίες.

Αναλυτικά το άρθρο:

Αγαπητοί φίλοι,

Την περασμένη εβδομάδα, οι New York Times (NYT) κατέθεσαν μήνυση κατά της OpenAI και της Microsoft, ισχυριζόμενοι μαζικές παραβιάσεις πνευματικών δικαιωμάτων. Η μήνυση:

Ισχυρίζεται, μεταξύ άλλων, ότι η OpenAI και η Microsoft χρησιμοποίησαν εκατομμύρια άρθρα των NYT που προστατεύονται από πνευματικά δικαιώματα για να εκπαιδεύσουν τα μοντέλα τους
Δίνει παραδείγματα στα οποία τα μοντέλα της OpenAI αναμασούσαν άρθρα των NYT σχεδόν αυτολεξεί

Συμπάσχω με τους εκδότες που ανησυχούν για την Generative AI που διαταράσσει τις επιχειρήσεις τους. Θεωρώ την ανεξάρτητη δημοσιογραφία βασικό πυλώνα της δημοκρατίας και συνεπώς κάτι που πρέπει να προστατευτεί. Παρ' όλα αυτά, υποστηρίζω τη θέση του OpenAI και της Microsoft περισσότερο από τη θέση των NYT. Διαβάζοντας τη μήνυση των NYT, βρήκα εκπληκτικά ασαφές τι πραγματικά συνέβη και ποια είναι η πραγματική ζημία.

(Προφανώς, οι δικηγόροι των NYT δεν τηρούν τα ίδια πρότυπα σαφήνειας στα γραπτά που τηρούν οι δημοσιογράφοι τους!)

Δεν είμαι δικηγόρος και δεν δίνω καμία νομική συμβουλή. Αλλά το πιο συγκεχυμένο μέρος της αγωγής είναι ότι φαίνεται να θολώνει τη σχέση μεταξύ των σημείων 1 και 2. Αυτό άφησε πολλούς σχολιαστές των μέσων κοινωνικής δικτύωσης να αναρωτιούνται πώς η εκπαίδευση σε άρθρα της NYT οδήγησε την ChatGPT να παράγει άρθρα κατά λέξη.

Υποψιάζομαι ότι πολλά από τα παραδείγματα αναμασημένων άρθρων δεν δημιουργήθηκαν χρησιμοποιώντας μόνο τα εκπαιδευμένα βάρη του μοντέλου, αλλά αντίθετα προέκυψαν από έναν μηχανισμό όπως ο RAG (retrieval augmented generation), στον οποίο το ChatGPT, το οποίο μπορεί να περιηγηθεί στον ιστό προς αναζήτηση σχετικών πληροφοριών, κατέβασε ένα άρθρο σε απάντηση στην προτροπή του χρήστη.

Πρώτον, όσον αφορά το σημείο 1, οι σημερινοί LLMs εκπαιδεύονται σε πολλά κείμενα με πνευματικά δικαιώματα. Όπως έγραψα προηγουμένως, πιστεύω ότι θα ήταν καλύτερο για την κοινωνία αν η εκπαίδευση των μοντέλων τεχνητής νοημοσύνης θεωρούνταν θεμιτή χρήση που δεν απαιτεί άδεια χρήσης. (Το κατά πόσον αυτό ισχύει στην πραγματικότητα θα μπορούσε να είναι ένα θέμα που θα αποφασίσουν οι νομοθέτες και τα δικαστήρια).

Ακριβώς όπως οι άνθρωποι επιτρέπεται να διαβάζουν άρθρα που δημοσιεύονται στο διαδίκτυο, να μαθαίνουν από αυτά και στη συνέχεια να χρησιμοποιούν αυτά που μαθαίνουν για να γράφουν ολοκαίνουργια άρθρα, θα ήθελα να δω τους υπολογιστές να μπορούν να κάνουν το ίδιο.

Όσον αφορά το σημείο 2, είδα μεγάλη σύγχυση - η οποία θα ήταν περιττή αν η αγωγή των NYT είχε εξηγήσει με μεγαλύτερη σαφήνεια τι συνέβαινε - σχετικά με τον συγκεκριμένο τεχνικό μηχανισμό με τον οποίο το ChatGPT μπορεί να αναμασήσει ένα άρθρο αυτολεξεί και συγκεκριμένα αν το 1 οδηγεί στο 2.

Θα ήθελα πολύ να δω τις NYT να εξηγούν με μεγαλύτερη σαφήνεια αν οι προφανείς αναμασήσεις προέρχονταν από (i) το LLM που παράγει κείμενο χρησιμοποιώντας τα προ-εκπαιδευμένα βάρη του ή (ii) μια δυνατότητα τύπου RAG, κατά την οποία έψαχνε στο διαδίκτυο για πληροφορίες σχετικές με την προτροπή. Αυτά είναι πολύ διαφορετικά πράγματα! Το να σταματήσει ένα LLM από το να αναμασά κείμενο που ανακτάται με τη χρήση μηχανισμού RAG φαίνεται τεχνικά πολύ εφικτό, οπότε το (ii) φαίνεται επιλύσιμο.

Επιπλέον, διαπιστώνω ότι μετά την προ-εκπαίδευση, η έξοδος ενός LLM - χωρίς έναν μηχανισμό τύπου RAG - είναι γενικά ένας μετασχηματισμός της εισόδου, και σχεδόν ποτέ μια κατά λέξη αναμάσησηση. Εάν αυτή η ανάλυση είναι ανακριβής, θα ήθελα να δω τους NYT να το διευκρινίζουν.

Πόσο κακό ακριβώς είναι το (ii); Μπορώ να χρησιμοποιήσω ένα διαδικτυακό σημειωματάριο Jupyter (ή άλλο περιβάλλον ανάπτυξης) και να γράψω οδηγίες που το αναγκάζουν να κατεβάζει και να εκτυπώνει άρθρα που προστατεύονται από πνευματικά δικαιώματα. Αν το κάνω αυτό, θα πρέπει ο πάροχος του σημειωματάριου Jupyter να θεωρηθεί υπεύθυνος για παραβίαση πνευματικών δικαιωμάτων; Εάν το σημειωματάριο Jupyter έχει πολλές άλλες χρήσεις που δεν παραβιάζουν, και η συντριπτική πλειονότητα των χρηστών το χρησιμοποιεί με τρόπους που δεν παραβιάζουν, και είναι μόνο η εσκεμμένη παροχή οδηγιών εκ μέρους μου που το κάνει να αναμασά ένα άρθρο, ελπίζω ότι τα δικαστήρια δεν θα θεωρήσουν τον πάροχο του σημειωματάριου Jupyter υπεύθυνο για τις πράξεις μου.

Ομοίως, πιστεύω ότι η συντριπτική πλειονότητα των παραγόμενων αποτελεσμάτων του OpenAI και της Microsoft είναι νέο κείμενο. Πόσο θα πρέπει λοιπόν να τους θεωρήσουμε υπεύθυνους όταν κάποιος είναι σε θέση να δώσει στο ChatGPT οδηγίες που το αναγκάζουν να κατεβάζει και να εκτυπώνει άρθρα που προστατεύονται από πνευματικά δικαιώματα;

Περαιτέρω, προς τιμήν του OpenAI, πιστεύω ότι το λογισμικό του έχει ήδη ενημερωθεί ώστε να κάνει την αναμάσηση των ληφθέντων άρθρων λιγότερο πιθανή. Για παράδειγμα, το ChatGPT φαίνεται τώρα να αρνείται να αναμασά τα κατεβασμένα άρθρα αυτολεξεί και επίσης περιστασιακά παραπέμπει στα άρθρα της πηγής, οδηγώντας έτσι την κυκλοφορία πίσω στη σελίδα που είχε χρησιμοποιήσει για το RAG. (Αυτό είναι παρόμοιο με τις μηχανές αναζήτησης που οδηγούν την επισκεψιμότητα πίσω σε πολλούς ιστότοπους, πράγμα που είναι εν μέρει ο λόγος για τον οποίο η προβολή αποσπασμάτων ιστότοπων στα αποτελέσματα αναζήτησης θεωρείται θεμιτή χρήση). Έτσι, απ' όσο μπορώ να πω, το OpenAI αντέδρασε λογικά και εποικοδομητικά.

Όταν το YouTube ξεκίνησε για πρώτη φορά, είχε κάποιο ενδιαφέρον, πρωτότυπο περιεχόμενο (πολλά βίντεο με γάτες, για παράδειγμα), αλλά ήταν επίσης μια εστία παραβιάσεων πνευματικών δικαιωμάτων. Πολλές αγωγές κατατέθηκαν εναντίον του YouTube και καθώς η πλατφόρμα ωρίμαζε, καθάρισε τα ζητήματα πνευματικών δικαιωμάτων.

Βλέπω το OpenAI και το Microsoft Azure να ωριμάζουν γρήγορα. Σε πολλούς εκδότες μπορεί να μην αρέσει το γεγονός ότι τα LLMs εκπαιδεύονται στο ιδιόκτητο περιεχόμενό τους. Αλλά ας μην συγχέουμε τα ζητήματα. Μέχρι στιγμής, βλέπω σχετικά λίγες αποδείξεις ότι αυτό οδηγεί σε αναμάσημα σχεδόν αυτολεξεί περιεχομένου σε τεράστιο αριθμό χρηστών.

Περαιτέρω, κλείνοντας τα παραθυράκια για το τι μπορούν και τι δεν μπορούν να κάνουν οι LLMs με περιήγηση στο διαδίκτυο, πολλά από τα ζητήματα της αναμάσησης περιεχομένου κατά λέξη μπορούν να επιλυθούν. Άλλα πιθανά ζητήματα, όπως η παραγωγή εικόνων που περιέχουν διάσημους χαρακτήρες (ακόμη και όταν δεν ζητείται ρητά να το κάνουν) μπορεί να είναι πιο δύσκολο να επιλυθούν, αλλά καθώς η βιομηχανία της Γενετικής Τεχνητής Νοημοσύνης συνεχίζει να ωριμάζει, είμαι αισιόδοξος ότι θα βρούμε καλές λύσεις σε αυτά τα προβλήματα.

Συνεχίστε να μαθαίνετε!

Andrew

Πηγή: Viewpoint of Andrew Ng

Η άποψη του Andrew Ng

Newsletter