Το εργαλείο OpenAI στοχεύει στην αποκάλυψη κειμένου που παράγεται από τεχνητή νοημοσύνη

14/02/2023 | | |

Περίληψη άρθρου:
Η OpenAI έχει λανσάρει ένα εργαλείο για την ανίχνευση κειμένου που παράγεται με τη χρήση υπηρεσιών όπως το δικό της ChatGPT. Αυτό το εργαλείο έχει ως στόχο να βοηθήσει στην πρόληψη της κατάχρησης κειμένου που παράγεται από τεχνητή νοημοσύνη για κακόβουλους σκοπούς, όπως η δημιουργία παραπληροφόρησης, η εξαπάτηση σε ακαδημαϊκούς κύκλους ή η παρουσίαση ενός chatbot ως ανθρώπου. Το εργαλείο είναι προς το παρόν αναξιόπιστο, καθώς αναγνωρίζει σωστά μόνο το 26% του κειμένου που έχει γραφτεί με τεχνητή νοημοσύνη και ταξινομεί λανθασμένα το κείμενο που έχει γραφτεί από άνθρωπο στο 9% των περιπτώσεων. Η OpenAI λαμβάνει επίσης μέτρα για να διασφαλίσει ότι τα ισχυρά παραγωγικά μοντέλα τεχνητής νοημοσύνης του, όπως το GPT και το DALL-E, χρησιμοποιούνται υπεύθυνα, όπως η παροχή εργαλείων και βέλτιστων πρακτικών για τους προγραμματιστές. Η OpenAI γνωρίζει επίσης τους πιθανούς κινδύνους των deepfakes και παίρνει το χρόνο της για να ελαχιστοποιήσει τους κινδύνους και να διατηρήσει τις προσδοκίες υπό έλεγχο.

Αναλυτικά το άρθρο:
Η OpenAI έχει ξεκινήσει ένα εργαλείο για την ανίχνευση κειμένου που παράγεται με τη χρήση υπηρεσιών όπως η δική της ChatGPT. Το εργαλείο έχει σχεδιαστεί για να βοηθήσει τους οργανισμούς να εντοπίζουν και να αφαιρούν κείμενο που παράγεται από μοντέλα τεχνητής νοημοσύνης, επιτρέποντάς τους να προστατεύουν τους χρήστες τους από πιθανή βλάβη. Ελπίζεται ότι αυτό το εργαλείο θα βοηθήσει να διασφαλιστεί ότι το κείμενο που παράγεται από AI χρησιμοποιείται υπεύθυνα και ηθικά.

Αυτή την εβδομάδα, το OpenAI παρουσίασε ένα νέο εργαλείο που ισχυρίζεται ότι μπορεί να διακρίνει το κείμενο που έχει γραφτεί από έναν άνθρωπο από εκείνο μιας τεχνητής νοημοσύνης. Ωστόσο, προειδοποιεί ότι επί του παρόντος είναι αναξιόπιστο. Σύμφωνα με το OpenAI, το εργαλείο αναγνωρίζει μόνο το 26% των κειμένων που έχουν γραφτεί από τεχνητή νοημοσύνη ως "πιθανότατα γραμμένα από τεχνητή νοημοσύνη" σε ένα σύνολο προκλήσεων αγγλικών κειμένων.

Επιπλέον, το εργαλείο ταξινομεί λανθασμένα κείμενο γραμμένο από άνθρωπο σε ποσοστό περίπου εννέα τοις εκατό του χρόνου. Το OpenAI πιστεύει ότι οι καλοί ταξινομητές μπορούν να ενημερώσουν για τον μετριασμό των ψευδών ισχυρισμών ότι το κείμενο που δημιουργήθηκε από τεχνητή νοημοσύνη γράφτηκε από άνθρωπο.

Αυτά τα μετριαστικά μέτρα περιλαμβάνουν την εκτέλεση αυτοματοποιημένων εκστρατειών παραπληροφόρησης, τη χρήση εργαλείων AI για ακαδημαϊκή ανεντιμότητα και την τοποθέτηση ενός AI chatbot ως ανθρώπου.

Το εργαλείο που παρέχεται από το OpenAI, το GPT, δεν πρέπει να χρησιμοποιείται ως η μοναδική μέθοδος προσδιορισμού της πηγής ενός κειμένου. Είναι αναξιόπιστο σε σύντομα κείμενα κάτω των 1.000 χαρακτήρων και είναι σημαντικά χειρότερο όταν εφαρμόζεται σε μη αγγλικά κείμενα. Το OpenAI παρείχε αρχικά πρόσβαση στο GPT σε έναν μικρό αριθμό αξιόπιστων ερευνητών και προγραμματιστών και αργότερα εισήγαγε μια λίστα αναμονής.

Η λίστα αναμονής καταργήθηκε τον Νοέμβριο του 2021, αλλά οι εργασίες για τη βελτίωση της ασφάλειας είναι μια συνεχής διαδικασία. Το GPT θα πρέπει να χρησιμοποιείται ως συμπλήρωμα άλλων μεθόδων προσδιορισμού της πηγής ενός κειμένου.

Το OpenAI δεσμεύεται να βοηθήσει τους προγραμματιστές να δημιουργήσουν εφαρμογές με υπευθυνότητα. Παρέχει εργαλεία και καθοδήγηση για να βοηθήσει τους προγραμματιστές να χρησιμοποιούν βέλτιστες πρακτικές και να θέτουν τις εφαρμογές τους σε παραγωγή γρήγορα και με ασφάλεια. Αναμένει επίσης να συνεχίσει τον εξορθολογισμό της διαδικασίας, να βελτιώσει τις οδηγίες χρήσης του και να επιτρέψει περισσότερες περιπτώσεις χρήσης με την πάροδο του χρόνου.

Επιπλέον, το OpenAI έχει εκφράσει την άποψη ότι υπάρχει υπερβολικός θόρυβος γύρω από το GPT-4 και ότι ένα μοντέλο που παράγει βίντεο θα έρθει τελικά, αλλά δεν είναι σε θέση να παράσχει χρονοδιάγραμμα.

Τα deepfakes αποτελούν ένα αυξανόμενο πρόβλημα, καθώς μπορούν να χρησιμοποιηθούν για τη διάπραξη απάτης, την παραπληροφόρηση και τη δυσφήμιση. Το OpenAI λαμβάνει μέτρα για την ελαχιστοποίηση των κινδύνων που σχετίζονται με τα deepfakes, διατηρώντας τις προσδοκίες υπό έλεγχο και δημιουργώντας εργαλεία για τον εντοπισμό τους. Ωστόσο, οι άνθρωποι εξακολουθούν να πείθονται εύκολα από αυτό που νομίζουν ότι μπορούν να δουν, καθιστώντας δύσκολη την καταπολέμηση των deepfakes.

Πηγή: OpenAI tool aims to uncover AI-generated text

Το εργαλείο OpenAI στοχεύει στην αποκάλυψη κειμένου που παράγεται από τεχνητή νοημοσύνη

Newsletter