Πώς να εκπαιδεύσετε το Generative AI χρησιμοποιώντας τα δεδομένα της εταιρείας σας

14/07/2023 | | |

Περίληψη άρθρου:
Οι εταιρείες χρησιμοποιούν όλο και περισσότερο μεγάλα γλωσσικά μοντέλα όπως το ChatGPT για την υποστήριξη πελατών και τη διαχείριση γνώσεων. Υπάρχουν τρεις προσεγγίσεις για την ενσωμάτωση ιδιόκτητου περιεχομένου σε αυτά τα μοντέλα: εκπαίδευση από το μηδέν, λεπτομερής ρύθμιση ενός υπάρχοντος μοντέλου και ρύθμιση με προτροπή. Η ρύθμιση με προτροπή είναι η πιο κοινή προσέγγιση λόγω της αποτελεσματικότητάς της και των χαμηλότερων απαιτήσεων σε δεδομένα. Ωστόσο, η επιμέλεια και η διακυβέρνηση του περιεχομένου είναι σημαντικές για τη διασφάλιση της ακρίβειας και της ποιότητας. Για να διασφαλιστεί η ακρίβεια και η ασφάλεια, οι εταιρείες θα πρέπει να αναπτύξουν στρατηγικές αξιολόγησης για τα παραγωγικά συστήματα τεχνητής νοημοσύνης τους. Αυτό μπορεί να περιλαμβάνει τη διεξαγωγή δοκιμών του συστήματος με γνωστές ερωτήσεις και την πιλοτική δοκιμή του με χρήστες. Τα νομικά ζητήματα και τα ζητήματα διακυβέρνησης που σχετίζονται με τα παραγωγικά συστήματα τεχνητής νοημοσύνης, όπως η πνευματική ιδιοκτησία, το απόρρητο των δεδομένων, η μεροληψία, η ηθική και η ψευδής παραγωγή, πρέπει να αντιμετωπιστούν με τη συμμετοχή νομικών εκπροσώπων στη διαδικασία δημιουργίας. Η συμπεριφορά των χρηστών θα πρέπει να διαμορφώνεται μέσω της διαφάνειας, της λογοδοσίας, των πολιτικών και των κατευθυντήριων γραμμών για την αποτελεσματική ενσωμάτωση των δυνατοτήτων της παραγωγικής ΤΝ στις εργασίες. Τα συστήματα αυτά μπορούν να αυτοματοποιήσουν τις διαδικασίες αναζήτησης και τις εργασίες ρουτίνας, δίνοντας ελεύθερο χρόνο στους υπαλλήλους για τη λήψη αποφάσεων και την επίλυση προβλημάτων. Οι εταιρείες θα πρέπει να είναι προετοιμασμένες να προσαρμόζουν την προσέγγισή τους καθώς προκύπτουν νέα μοντέλα και μέθοδοι συντονισμού. Παρά τις προκλήσεις, ο μακροπρόθεσμος στόχος της εύκολης πρόσβασης σε σημαντικές γνώσεις εντός μιας εταιρείας με τη χρήση γεννητικής ΤΝ αξίζει να επιδιωχθεί.

Κύρια σημεία του άρθρου:

Οι εταιρείες χρησιμοποιούν μεγάλα γλωσσικά μοντέλα ή μοντέλα εικόνας για να βελτιώσουν τη διαχείριση της γνώσης και τις ικανότητες καινοτομίας.
Τρεις προσεγγίσεις για την ενσωμάτωση ιδιόκτητου περιεχομένου είναι η εκπαίδευση ενός LLM από το μηδέν, η λεπτομερής ρύθμιση ενός υπάρχοντος LLM και η άμεση ρύθμιση ενός υπάρχοντος LLM.
Κάθε προσέγγιση έχει τις δικές της προκλήσεις και απαιτήσεις όσον αφορά τα δεδομένα, την υπολογιστική ισχύ και την εμπειρογνωμοσύνη.
Η επιμέλεια του περιεχομένου και η διακυβέρνηση είναι ζωτικής σημασίας για την ακρίβεια και την ποιότητα της γνώσης που ενσωματώνεται στα μοντέλα.
Τα νομικά ζητήματα και τα ζητήματα διακυβέρνησης που σχετίζονται με την ανάπτυξη LLM απαιτούν τη συμμετοχή νομικών εκπροσώπων.
Οι εταιρείες θα πρέπει να είναι προετοιμασμένες να αναθεωρούν συχνά την προσέγγισή τους καθώς εξελίσσεται ο τομέας της παραγωγικής ΤΝ.

Αναλυτικά το άρθρο:
Πολλές εταιρείες πειραματίζονται με το ChatGPT και άλλα μεγάλα μοντέλα γλώσσας ή εικόνας. Γενικά, τα έχουν βρει εκπληκτικά όσον αφορά την ικανότητά τους να εκφράζουν πολύπλοκες ιδέες σε εύληπτη γλώσσα. Ωστόσο, οι περισσότεροι χρήστες συνειδητοποιούν ότι αυτά τα συστήματα εκπαιδεύονται κυρίως σε πληροφορίες που βασίζονται στο διαδίκτυο και δεν μπορούν να ανταποκριθούν σε προτροπές ή ερωτήσεις σχετικά με ιδιόκτητο περιεχόμενο ή γνώσεις.

Η αξιοποίηση των ιδιόκτητων γνώσεων μιας εταιρείας είναι ζωτικής σημασίας για την ικανότητά της να ανταγωνίζεται και να καινοτομεί, ιδίως στο σημερινό ασταθές περιβάλλον. Η οργανωτική καινοτομία τροφοδοτείται μέσω της αποτελεσματικής και ευέλικτης δημιουργίας, διαχείρισης, εφαρμογής, ανασυνδυασμού και ανάπτυξης των περιουσιακών στοιχείων γνώσης και της τεχνογνωσίας. Ωστόσο, η γνώση εντός των οργανισμών συνήθως παράγεται και συλλέγεται σε διάφορες πηγές και μορφές, συμπεριλαμβανομένων των ατομικών μυαλών, των διαδικασιών, των πολιτικών, των εκθέσεων, των επιχειρησιακών συναλλαγών, των φόρουμ συζητήσεων και των διαδικτυακών συνομιλιών και συναντήσεων. Ως εκ τούτου, η ολοκληρωμένη γνώση μιας εταιρείας συχνά δεν υπολογίζεται και είναι δύσκολο να οργανωθεί και να αναπτυχθεί όπου χρειάζεται με αποτελεσματικό ή αποδοτικό τρόπο.

Οι αναδυόμενες τεχνολογίες με τη μορφή μεγάλων γλωσσικών μοντέλων και μοντέλων ΤΝ που δημιουργούν εικόνες προσφέρουν νέες ευκαιρίες για τη διαχείριση της γνώσης, ενισχύοντας έτσι την απόδοση, τη μάθηση και τις δυνατότητες καινοτομίας της εταιρείας. Για παράδειγμα, σε μια μελέτη που διεξήχθη σε έναν πάροχο λογισμικού επιχειρηματικών διαδικασιών του Fortune 500, ένα σύστημα βασισμένο στη γεννητική ΤΝ για την υποστήριξη πελατών οδήγησε σε αύξηση της παραγωγικότητας των υπαλλήλων υποστήριξης πελατών και σε βελτίωση της διατήρησης, ενώ οδήγησε σε υψηλότερα θετικά σχόλια εκ μέρους των πελατών. Το σύστημα επιτάχυνε επίσης την εκμάθηση και την ανάπτυξη δεξιοτήτων των αρχάριων υπαλλήλων.

Όπως η εν λόγω εταιρεία, ένας αυξανόμενος αριθμός οργανισμών προσπαθεί να αξιοποιήσει τις δεξιότητες γλωσσικής επεξεργασίας και τις γενικές ικανότητες συλλογισμού των μεγάλων γλωσσικών μοντέλων (LLM) για να κατανοήσει και να παράσχει ευρεία εσωτερική (ή πελατειακή) πρόσβαση στο δικό τους διανοητικό κεφάλαιο. Το χρησιμοποιούν για σκοπούς όπως η ενημέρωση των υπαλλήλων τους που απευθύνονται στους πελάτες τους σχετικά με την πολιτική της εταιρείας και τις συστάσεις προϊόντων/υπηρεσιών, η επίλυση προβλημάτων εξυπηρέτησης πελατών ή η καταγραφή των γνώσεων των υπαλλήλων πριν αποχωρήσουν από τον οργανισμό.

Αυτοί οι στόχοι ήταν επίσης παρόντες κατά την διάρκεια της κορύφωσης του κινήματος της "διαχείρισης της γνώσης" στη δεκαετία του 1990 και στις αρχές της δεκαετίας του 2000, αλλά οι περισσότερες εταιρείες βρήκαν την τεχνολογία της εποχής ανεπαρκή για το έργο αυτό. Σήμερα, ωστόσο, η δημιουργική τεχνητή νοημοσύνη αναζωπυρώνει τη δυνατότητα σύλληψης και διάδοσης σημαντικών γνώσεων σε ολόκληρο τον οργανισμό και εκτός των τειχών του. Όπως το έθεσε ένας μάνατζερ που χρησιμοποιεί τη γενεσιουργό ΤΝ για τον σκοπό αυτό, "νιώθω σαν να μπήκε στη ζωή μου ένα τζετ-πακ". Παρά τις σημερινές εξελίξεις, ορισμένοι από τους ίδιους παράγοντες που καθιστούσαν δύσκολη τη διαχείριση της γνώσης στο παρελθόν εξακολουθούν να είναι παρόντες.

Η τεχνολογία για τη διαχείριση της γνώσης με βάση τη δημιουργική τεχνητή νοημοσύνη

Η τεχνολογία για την ενσωμάτωση της ειδικής γνώσης ενός οργανισμού σε ένα LLM εξελίσσεται ραγδαία. Αυτή τη στιγμή υπάρχουν τρεις κύριες προσεγγίσεις για την ενσωμάτωση ιδιόκτητου περιεχομένου σε ένα παραγωγικό μοντέλο.

Μια προσέγγιση είναι η δημιουργία και η εκπαίδευση του δικού μας μοντέλου για συγκεκριμένο τομέα από το μηδέν. Αυτή δεν είναι μια συνηθισμένη προσέγγιση, δεδομένου ότι απαιτείται ένας τεράστιος όγκος δεδομένων υψηλής ποιότητας για την εκπαίδευση ενός μεγάλου γλωσσικού μοντέλου, και οι περισσότερες εταιρείες απλώς δεν το διαθέτουν. Απαιτεί επίσης πρόσβαση σε σημαντική υπολογιστική ισχύ και καλά εκπαιδευμένο ταλέντο στην επιστήμη των δεδομένων.

Μια εταιρεία που έχει χρησιμοποιήσει αυτή την προσέγγιση είναι το Bloomberg, το οποίο ανακοίνωσε πρόσφατα ότι δημιούργησε το BloombergGPT για περιεχόμενο ειδικά για τα χρηματοοικονομικά και μια διεπαφή φυσικής γλώσσας με το τερματικό δεδομένων του. Το Bloomberg διαθέτει χρηματοοικονομικά δεδομένα, ειδήσεις και έγγραφα αξίας άνω των 40 ετών, τα οποία συνδύασε με μεγάλο όγκο κειμένου από οικονομικές καταθέσεις και δεδομένα του διαδικτύου. Συνολικά, οι επιστήμονες δεδομένων του Bloomberg χρησιμοποίησαν 700 tokens, δηλαδή περίπου 350 δισεκατομμύρια λέξεις, 50 δισεκατομμύρια παραμέτρους και 1,3 εκατομμύρια ώρες χρόνου μονάδας επεξεργασίας γραφικών. Λίγες εταιρείες έχουν στη διάθεσή τους αυτούς τους πόρους.

Τελειοποίηση ενός υπάρχοντος LLM

Μια δεύτερη προσέγγιση είναι η "τελειοποίηση" της εκπαίδευσης ενός υπάρχοντος LLM για την προσθήκη ειδικού περιεχομένου τομέα σε ένα σύστημα που έχει ήδη εκπαιδευτεί στη γενική γνώση και την αλληλεπίδραση με βάση τη γλώσσα. Αυτή η προσέγγιση περιλαμβάνει την προσαρμογή ορισμένων παραμέτρων ενός βασικού μοντέλου και συνήθως απαιτεί σημαντικά λιγότερα δεδομένα - συνήθως μόνο εκατοντάδες ή χιλιάδες έγγραφα, αντί για εκατομμύρια ή δισεκατομμύρια - και λιγότερο υπολογιστικό χρόνο από τη δημιουργία ενός νέου μοντέλου από το μηδέν.

Η Google, για παράδειγμα, χρησιμοποίησε την εκπαίδευση λεπτομερούς συντονισμού στο μοντέλο Med-PaLM2 (δεύτερη έκδοση) για τις ιατρικές γνώσεις. Το ερευνητικό έργο ξεκίνησε με το γενικό μοντέλο LLM PaLM2 της Google και το εκπαίδευσε εκ νέου σε προσεκτικά επιμελημένες ιατρικές γνώσεις από διάφορα δημόσια σύνολα ιατρικών δεδομένων. Το μοντέλο μπόρεσε να απαντήσει στο 85% των ερωτήσεων για τις εξετάσεις ιατρικών αδειών των ΗΠΑ - σχεδόν 20% καλύτερα από την πρώτη έκδοση του συστήματος. Παρά την ταχεία αυτή πρόοδο, όταν δοκιμάστηκε σε κριτήρια όπως η επιστημονική πραγματολογία, η ακρίβεια, η ιατρική συναίνεση, η επιχειρηματολογία, η μεροληψία και η βλάβη, και αξιολογήθηκε από ανθρώπους εμπειρογνώμονες από πολλές χώρες, η ομάδα ανάπτυξης θεώρησε ότι το σύστημα χρειαζόταν ακόμη σημαντική βελτίωση προτού υιοθετηθεί για την κλινική πρακτική.

Ωστόσο, η προσέγγιση της τελειοποίησης έχει ορισμένους περιορισμούς. Παρόλο που απαιτεί πολύ λιγότερη υπολογιστική ισχύ και χρόνο από την εκπαίδευση ενός LLM, μπορεί να είναι ακριβή η εκπαίδευσή του, κάτι που δεν αποτελούσε πρόβλημα για την Google, αλλά θα ήταν για πολλές άλλες εταιρείες. Απαιτεί σημαντική τεχνογνωσία στην επιστήμη των δεδομένων- η επιστημονική εργασία για το έργο της Google, για παράδειγμα, είχε 31 συνεργάτες. Ορισμένοι επιστήμονες δεδομένων υποστηρίζουν ότι είναι καταλληλότερο όχι για την προσθήκη νέου περιεχομένου, αλλά μάλλον για την προσθήκη νέων μορφών και στυλ περιεχομένου (όπως η συνομιλία ή η γραφή όπως ο Ουίλιαμ Σαίξπηρ). Επιπλέον, ορισμένοι προμηθευτές LLM (για παράδειγμα, η OpenAI) δεν επιτρέπουν τη λεπτομερή ρύθμιση στα πιο πρόσφατα LLM τους, όπως το GPT-4.

Προτροπή-ρύθμιση ενός υπάρχοντος LLM

Ίσως η πιο συνηθισμένη προσέγγιση για την προσαρμογή του περιεχομένου ενός LLM για τις εταιρείες που δεν είναι προμηθευτές cloud είναι ο συντονισμός του μέσω προτροπών. Με αυτή την προσέγγιση, το αρχικό μοντέλο διατηρείται παγωμένο και τροποποιείται μέσω προτροπών στο παράθυρο περιβάλλοντος που περιέχουν ειδικές για τον τομέα γνώσεις. Μετά τη ρύθμιση των προτροπών, το μοντέλο μπορεί να απαντήσει σε ερωτήσεις που σχετίζονται με αυτή τη γνώση. Αυτή η προσέγγιση είναι η πιο αποδοτική από υπολογιστική άποψη από τις τρεις και δεν απαιτεί τεράστιο όγκο δεδομένων για την εκπαίδευσή του σε έναν νέο τομέα περιεχομένου.

Η Morgan Stanley, για παράδειγμα, χρησιμοποίησε prompt tuning για να εκπαιδεύσει το μοντέλο GPT-4 του OpenAI χρησιμοποιώντας ένα προσεκτικά επιμελημένο σύνολο 100.000 εγγράφων με σημαντικές γνώσεις σχετικά με τις επενδύσεις, τις γενικές επιχειρήσεις και τις επενδυτικές διαδικασίες. Ο στόχος ήταν να παρέχει στους χρηματοοικονομικούς συμβούλους της εταιρείας ακριβείς και εύκολα προσβάσιμες γνώσεις για βασικά ζητήματα που αντιμετωπίζουν στο ρόλο τους ως σύμβουλοι πελατών. Το σύστημα που εκπαιδεύτηκε άμεσα λειτουργεί σε ένα ιδιωτικό cloud, στο οποίο έχουν πρόσβαση μόνο οι εργαζόμενοι της Morgan Stanley.

Αν και αυτή είναι ίσως η ευκολότερη από τις τρεις προσεγγίσεις που μπορεί να υιοθετήσει ένας οργανισμός, δεν στερείται τεχνικών προκλήσεων. Όταν χρησιμοποιούνται μη δομημένα δεδομένα, όπως κείμενο, ως είσοδος σε ένα LLM, τα δεδομένα είναι πιθανό να είναι πολύ μεγάλα με πάρα πολλά σημαντικά χαρακτηριστικά για να εισαχθούν απευθείας στο παράθυρο περιβάλλοντος για το LLM. Η εναλλακτική λύση είναι να δημιουργηθούν διανυσματικές ενσωματώσεις - πίνακες αριθμητικών τιμών που παράγονται από το κείμενο από ένα άλλο προ-εκπαιδευμένο μοντέλο μηχανικής μάθησης (η Morgan Stanley χρησιμοποιεί ένα από την OpenAI που ονομάζεται Ada). Οι διανυσματικές ενσωματώσεις είναι μια πιο συμπαγής αναπαράσταση αυτών των δεδομένων που διατηρεί τις σχέσεις πλαισίου στο κείμενο. Όταν ένας χρήστης εισάγει μια προτροπή στο σύστημα, ένας αλγόριθμος ομοιότητας καθορίζει ποια διανύσματα πρέπει να υποβληθούν στο μοντέλο GPT-4. Παρόλο που αρκετοί προμηθευτές προσφέρουν εργαλεία για να κάνουν αυτή τη διαδικασία συντονισμού των προτροπών ευκολότερη, εξακολουθεί να είναι αρκετά περίπλοκη ώστε οι περισσότερες εταιρείες που υιοθετούν την προσέγγιση θα πρέπει να διαθέτουν σημαντικό ταλέντο στην επιστήμη των δεδομένων.

Ωστόσο, η προσέγγιση αυτή δεν χρειάζεται να είναι πολύ χρονοβόρα ή δαπανηρή, εάν το απαιτούμενο περιεχόμενο είναι ήδη παρόν. Η εταιρεία επενδυτικών ερευνών Morningstar, για παράδειγμα, χρησιμοποίησε prompt tuning και διανυσματικές ενσωματώσεις για το ερευνητικό εργαλείο Mo που βασίζεται στη γεννητική τεχνητή νοημοσύνη. Ενσωματώνει περισσότερα από 10.000 κομμάτια της έρευνας της Morningstar. Μετά από περίπου ένα μήνα εργασίας στο σύστημά της, η Morningstar ξεκίνησε τη χρήση του Mo στους χρηματοοικονομικούς συμβούλους της και στους ανεξάρτητους επενδυτές πελάτες της. Σύνδεσε μάλιστα το Mo με ένα ψηφιακό εικονίδιο (avatar) που μπορούσε να εκφέρει τις απαντήσεις του. Αυτή η τεχνική προσέγγιση δεν είναι δαπανηρή- τον πρώτο μήνα χρήσης του, το Mo απάντησε σε 25.000 ερωτήσεις με μέσο κόστος 0,002 δολάρια ανά ερώτηση, με συνολικό κόστος 3.000 δολάρια.

Επιμέλεια περιεχομένου και διακυβέρνηση

Όπως και με την παραδοσιακή διαχείριση της γνώσης στην οποία τα έγγραφα φορτώθηκαν σε βάσεις δεδομένων συζητήσεων όπως το Microsoft Sharepoint, με τη δημιουργική τεχνητή νοημοσύνη, το περιεχόμενο πρέπει να είναι υψηλής ποιότητας πριν από την προσαρμογή των LLM με οποιονδήποτε τρόπο.

Σε ορισμένες περιπτώσεις, όπως με το σύστημα Google Med-PaLM2, υπάρχουν ευρέως διαθέσιμες βάσεις δεδομένων ιατρικής γνώσης που έχουν ήδη επιμεληθεί. Διαφορετικά, μια εταιρεία πρέπει να βασιστεί στην ανθρώπινη επιμέλεια για να διασφαλίσει ότι το περιεχόμενο γνώσεων είναι ακριβές, έγκαιρο και δεν επαναλαμβάνεται. Η Morgan Stanley, για παράδειγμα, διαθέτει μια ομάδα 20 περίπου διαχειριστών τεχνογνωσίας στις Φιλιππίνες, οι οποίοι βαθμολογούν συνεχώς τα έγγραφα με βάση πολλαπλά κριτήρια- αυτά καθορίζουν την καταλληλότητα για ενσωμάτωση στο σύστημα GPT-4. Οι περισσότερες εταιρείες που δεν διαθέτουν καλά επιμελημένο περιεχόμενο θα δυσκολευτούν να το κάνουν για αυτόν ακριβώς τον σκοπό.

Η Morgan Stanley διαπίστωσε επίσης ότι είναι πολύ πιο εύκολο να διατηρηθεί η υψηλή ποιότητα της γνώσης εάν οι συντάκτες περιεχομένου γνωρίζουν πώς να δημιουργούν αποτελεσματικά έγγραφα. Απαιτείται να παρακολουθήσουν δύο μαθήματα, ένα για το εργαλείο διαχείρισης εγγράφων και ένα δεύτερο για τον τρόπο σύνταξης και επισήμανσης αυτών των εγγράφων. Αυτό αποτελεί συστατικό στοιχείο της προσέγγισης της εταιρείας για την προσέγγιση της διακυβέρνησης περιεχομένου - μια συστηματική μέθοδο για την καταγραφή και τη διαχείριση σημαντικού ψηφιακού περιεχομένου.

Στη Morningstar, οι δημιουργοί περιεχομένου διδάσκονται ποιο είδος περιεχομένου λειτουργεί καλά με το σύστημα Mo και ποιο όχι. Υποβάλλουν το περιεχόμενό τους σε ένα σύστημα διαχείρισης περιεχομένου και αυτό πηγαίνει απευθείας στη διανυσματική βάση δεδομένων που παρέχει το μοντέλο OpenAI.

Διασφάλιση ποιότητας και αξιολόγηση

Μια σημαντική πτυχή της διαχείρισης του περιεχομένου της δημιουργικής τεχνητής νοημοσύνης είναι η διασφάλιση της ποιότητας. Είναι ευρέως γνωστό ότι η γεννητική ΤΝ έχει "παραισθήσεις" σε ορισμένες περιπτώσεις, δηλώνοντας με αυτοπεποίθηση γεγονότα που είναι λανθασμένα ή ανύπαρκτα. Τα λάθη αυτού του τύπου μπορεί να είναι προβληματικά για τις επιχειρήσεις, αλλά θα μπορούσαν να καταστούν θανατηφόρα σε εφαρμογές υγειονομικής περίθαλψης. Τα καλά νέα είναι ότι οι εταιρείες που έχουν συντονίσει τα LLMs τους σε πληροφορίες που αφορούν συγκεκριμένο τομέα έχουν διαπιστώσει ότι οι ψευδαισθήσεις αποτελούν λιγότερο πρόβλημα από τα out-of-the-box LLMs, τουλάχιστον εάν δεν υπάρχουν εκτεταμένοι διάλογοι ή μη επιχειρηματικές προτροπές.

Οι εταιρείες που υιοθετούν αυτές τις προσεγγίσεις για τη γεννητική διαχείριση γνώσης ΤΝ θα πρέπει να αναπτύξουν μια στρατηγική αξιολόγησης. Για παράδειγμα, για το BloombergGPT, το οποίο προορίζεται για την απάντηση χρηματοοικονομικών και επενδυτικών ερωτήσεων, το σύστημα αξιολογήθηκε σε δημόσια σύνολα δεδομένων χρηματοοικονομικών εργασιών, αναγνώρισης ονομαστικών οντοτήτων, ικανότητας ανάλυσης συναισθήματος και σε ένα σύνολο εργασιών συλλογισμού και γενικής επεξεργασίας φυσικής γλώσσας. Το σύστημα Google Med-PaLM2, το οποίο τελικά προσανατολίζεται στην απάντηση ιατρικών ερωτήσεων ασθενών και ιατρών, είχε μια πολύ πιο εκτεταμένη στρατηγική αξιολόγησης, η οποία αντανακλά την κρισιμότητα της ακρίβειας και της ασφάλειας στον ιατρικό τομέα.

Η ζωή ή ο θάνατος δεν είναι ζήτημα για τη Morgan Stanley, αλλά η παραγωγή εξαιρετικά ακριβών απαντήσεων σε οικονομικές και επενδυτικές ερωτήσεις είναι σημαντική για την εταιρεία, τους πελάτες της και τις ρυθμιστικές αρχές της. Οι απαντήσεις που παρείχε το σύστημα αξιολογήθηκαν προσεκτικά από ανθρώπινους κριτές πριν δοθεί σε οποιονδήποτε χρήστη. Στη συνέχεια, δοκιμάστηκε πειραματικά για αρκετούς μήνες από 300 χρηματοοικονομικούς συμβούλους. Ως κύρια προσέγγιση για τη συνεχή αξιολόγηση, η Morgan Stanley διαθέτει ένα σύνολο 400 "χρυσών ερωτήσεων" στις οποίες είναι γνωστές οι σωστές απαντήσεις. Κάθε φορά που γίνεται οποιαδήποτε αλλαγή στο σύστημα, οι υπάλληλοι το δοκιμάζουν με τις χρυσές ερωτήσεις για να δουν αν υπήρξε "παλινδρόμηση" ή λιγότερο ακριβείς απαντήσεις.

Νομικά ζητήματα και θέματα διακυβέρνησης

Τα νομικά ζητήματα και τα ζητήματα διακυβέρνησης που σχετίζονται με την ανάπτυξη του LLM είναι πολύπλοκα και εξελίσσονται, οδηγώντας σε παράγοντες κινδύνου που αφορούν την πνευματική ιδιοκτησία, το απόρρητο και την ασφάλεια των δεδομένων, τη μεροληψία και τη δεοντολογία, καθώς και την ψευδή/ανακριβή παραγωγή. Επί του παρόντος, το νομικό καθεστώς των εκροών του LLM είναι ακόμη ασαφές.

Δεδομένου ότι τα LLM δεν παράγουν ακριβή αντίγραφα οποιουδήποτε κειμένου που χρησιμοποιήθηκε για την εκπαίδευση του μοντέλου, πολλοί νομικοί παρατηρητές θεωρούν ότι οι διατάξεις περί "δίκαιης χρήσης" του νόμου περί πνευματικών δικαιωμάτων θα εφαρμόζονται σε αυτά, αν και αυτό δεν έχει δοκιμαστεί στα δικαστήρια (και δεν έχουν όλες οι χώρες τέτοιες διατάξεις στους νόμους περί πνευματικών δικαιωμάτων). Σε κάθε περίπτωση, είναι καλή ιδέα για κάθε εταιρεία που κάνει εκτεταμένη χρήση της παραγωγικής ΤΝ για τη διαχείριση της γνώσης (ή για τους περισσότερους άλλους σκοπούς για αυτό το θέμα) να έχει νομικούς εκπροσώπους που συμμετέχουν στη διαδικασία δημιουργίας και διακυβέρνησης για συντονισμένα LLM. Στη Morningstar, για παράδειγμα, οι δικηγόροι της εταιρείας βοήθησαν στη δημιουργία μιας σειράς " προ-προτροπών " που λένε στο σύστημα της παραγωγικής ΤΝ τι είδους ερωτήσεις πρέπει να απαντήσει και τι είδους ερωτήσεις πρέπει ευγενικά να αποφύγει.

Οι προτροπές των χρηστών σε δημόσια διαθέσιμα LLM χρησιμοποιούνται για την εκπαίδευση μελλοντικών εκδόσεων του συστήματος, οπότε ορισμένες εταιρείες (η Samsung, για παράδειγμα) φοβήθηκαν τη διάδοση εμπιστευτικών και ιδιωτικών πληροφοριών και απαγόρευσαν τη χρήση LLM από τους υπαλλήλους. Ωστόσο, οι προσπάθειες των περισσότερων εταιρειών να συντονίσουν τα LLMs με περιεχόμενο ειδικά για τον τομέα εκτελούνται σε ιδιωτικές περιπτώσεις των μοντέλων που δεν είναι προσβάσιμες σε δημόσιους χρήστες, οπότε αυτό δεν θα πρέπει να αποτελεί πρόβλημα. Επιπλέον, ορισμένα παραγωγικά συστήματα ΤΝ, όπως το ChatGPT, επιτρέπουν στους χρήστες να απενεργοποιούν τη συλλογή ιστορικών συνομιλιών, γεγονός που μπορεί να αντιμετωπίσει ζητήματα εμπιστευτικότητας ακόμη και σε δημόσια συστήματα.

Προκειμένου να αντιμετωπιστούν οι ανησυχίες για την εμπιστευτικότητα και την προστασία της ιδιωτικής ζωής, ορισμένοι προμηθευτές παρέχουν προηγμένα και βελτιωμένα χαρακτηριστικά ασφάλειας και προστασίας για τα LLM, συμπεριλαμβανομένων της διαγραφής των προτροπών του χρήστη, του περιορισμού ορισμένων θεμάτων και της αποτροπής της εισαγωγής πηγαίου κώδικα και δεδομένων ιδιοκτησίας σε LLM με δημόσια πρόσβαση. Επιπλέον, οι πωλητές εταιρικών συστημάτων λογισμικού ενσωματώνουν ένα "στρώμα εμπιστοσύνης" στα προϊόντα και τις υπηρεσίες τους. Η Salesforce, για παράδειγμα, ενσωμάτωσε τη λειτουργία Einstein GPT στη σουίτα AI Cloud για να αντιμετωπίσει το "AI Trust Gap" μεταξύ των εταιρειών που επιθυμούν να αναπτύξουν γρήγορα δυνατότητες LLM και των προαναφερθέντων κινδύνων που ενέχουν τα συστήματα αυτά σε επιχειρηματικά περιβάλλοντα.

Διαμόρφωση της συμπεριφοράς των χρηστών

Η ευκολία χρήσης, η ευρεία δημόσια διαθεσιμότητα και οι χρήσιμες απαντήσεις που καλύπτουν διάφορους τομείς γνώσης οδήγησαν στην ταχεία και κάπως μη καθοδηγούμενη και οργανική υιοθέτηση της διαχείρισης γνώσης με βάση τη δημιουργική ΤΝ από τους εργαζόμενους. Για παράδειγμα, μια πρόσφατη έρευνα έδειξε ότι πάνω από το ένα τρίτο των εργαζομένων που συμμετείχαν στην έρευνα χρησιμοποιούσαν την παραγωγική τεχνητή νοημοσύνη στη δουλειά τους, αλλά το 68% των ερωτηθέντων δεν ενημέρωσε τους προϊσταμένους τους ότι χρησιμοποιούσαν το εργαλείο. Για να αξιοποιήσουν τις ευκαιρίες και να διαχειριστούν τους πιθανούς κινδύνους των εφαρμογών της παραγωγικής ΤΝ στη διαχείριση γνώσης, οι εταιρείες πρέπει να αναπτύξουν μια κουλτούρα διαφάνειας και λογοδοσίας που θα καταστήσει επιτυχή τα συστήματα διαχείρισης γνώσης που βασίζονται στη παραγωγική ΤΝ.

Εκτός από την εφαρμογή πολιτικών και κατευθυντήριων γραμμών, οι χρήστες πρέπει να κατανοήσουν πώς να ενσωματώνουν με ασφάλεια και αποτελεσματικότητα τις δυνατότητες δημιουργικής τεχνητής νοημοσύνης στα καθήκοντά τους για να βελτιώσουν τις επιδόσεις και την παραγωγικότητα. Οι δυνατότητες της δημιουργικής ΤΝ, συμπεριλαμβανομένης της επίγνωσης του πλαισίου και του ιστορικού, της δημιουργίας νέου περιεχομένου με τη συγκέντρωση ή το συνδυασμό γνώσεων από διάφορες πηγές και των προβλέψεων βάσει δεδομένων, μπορούν να παρέχουν ισχυρή υποστήριξη για την εργασία γνώσης. Τα συστήματα διαχείρισης γνώσης με βάση τη δημιουργική ΤΝ μπορούν να αυτοματοποιήσουν διαδικασίες αναζήτησης έντασης πληροφοριών (π.χ. έρευνα νομικών υποθέσεων), καθώς και γνωστικές εργασίες υψηλού όγκου και χαμηλής πολυπλοκότητας, όπως η απάντηση σε συνηθισμένα μηνύματα ηλεκτρονικού ταχυδρομείου πελατών. Η προσέγγιση αυτή αυξάνει την αποδοτικότητα των εργαζομένων, απαλλάσσοντάς τους από τη δυνατότητα να καταβάλλουν μεγαλύτερη προσπάθεια στις σύνθετες πτυχές της λήψης αποφάσεων και της επίλυσης προβλημάτων της εργασίας τους.

Ορισμένες συγκεκριμένες συμπεριφορές που θα ήταν επιθυμητό να εμπεδωθούν - είτε μέσω εκπαίδευσης είτε μέσω πολιτικών - περιλαμβάνουν:

Γνώση των τύπων περιεχομένου που είναι διαθέσιμα μέσω του συστήματος
Πώς να δημιουργήσετε αποτελεσματικές οδηγίες
Ποιοι τύποι προτροπών και διαλόγων επιτρέπονται και ποιοι όχι
Πώς να ζητήσετε την προσθήκη πρόσθετου γνωστικού περιεχομένου στο σύστημα
Πώς να χρησιμοποιείτε τις απαντήσεις του συστήματος στις συναλλαγές με πελάτες και συνεργάτες
Πώς να δημιουργείτε νέο περιεχόμενο με χρήσιμο και αποτελεσματικό τρόπο

Τόσο η Morgan Stanley όσο και η Morningstar εκπαίδευσαν ειδικότερα τους δημιουργούς περιεχομένου σχετικά με τον καλύτερο τρόπο δημιουργίας και επισήμανσης του περιεχομένου, καθώς και με το ποιοι τύποι περιεχομένου είναι κατάλληλοι για γεννητική χρήση τεχνητής νοημοσύνης.

"Όλα κινούνται πολύ γρήγορα"

Ένα από τα στελέχη που πήραμε συνέντευξη είπε: "Μπορώ να σας πω πώς είναι τα πράγματα σήμερα. Αλλά όλα κινούνται πολύ γρήγορα σε αυτόν τον τομέα". Καθημερινά ανακοινώνονται νέα LLM και νέες προσεγγίσεις για τον συντονισμό του περιεχομένου τους, όπως και νέα προϊόντα από προμηθευτές με συγκεκριμένο περιεχόμενο ή εστίαση εργασιών. Κάθε εταιρεία που δεσμεύεται να ενσωματώσει τη δική της γνώση σε ένα σύστημα δημιουργικής ΤΝ θα πρέπει να είναι προετοιμασμένη να αναθεωρεί συχνά την προσέγγισή της στο θέμα κατά τα επόμενα χρόνια.

Παρόλο που υπάρχουν πολλά δύσκολα ζητήματα που σχετίζονται με τη δημιουργία και τη χρήση συστημάτων δημιουργικής τεχνητής νοημοσύνης που εκπαιδεύονται στο περιεχόμενο γνώσης της ίδιας της εταιρείας, είμαστε βέβαιοι ότι το συνολικό όφελος για την εταιρεία αξίζει την προσπάθεια για την αντιμετώπιση αυτών των προκλήσεων. Το μακροπρόθεσμο όραμα να δοθεί η δυνατότητα σε κάθε εργαζόμενο - αλλά και στους πελάτες - να έχει εύκολη πρόσβαση σε σημαντικές γνώσεις εντός και εκτός της εταιρείας για την ενίσχυση της παραγωγικότητας και της καινοτομίας αποτελεί ισχυρό πλεονέκτημα. Η δημιουργική τεχνητή νοημοσύνη φαίνεται να είναι η τεχνολογία που το καθιστά τελικά εφικτό.

Πηγή: How to Train Generative AI Using Your Company’s Data

Πώς να εκπαιδεύσετε το Generative AI χρησιμοποιώντας τα δεδομένα της εταιρείας σας

Newsletter