14 Δεκέμβριος 2017

Μεγάλα Δεδομένα: η «χρυσή» προοπτική της μηχανικής μάθησης στις επιχειρηματικές αναλύσεις

Το μεγάλο μπαμ των συναλλαγών μεταξύ επιχειρήσεων (B2B) στην αγορά μεγάλων δεδομένων (από μια επιχείρηση μικρότερη των 100 εκ. δολαρίων το 2009 σε μία των 130 δισ. σήμερα) αντικατοπτρίζει έναν επιχειρηματικό αγώνα για επενδύσεις στην εξόρυξη δεδομένων, που θυμίζει τον «Πυρετό του Χρυσού» στην Καλιφόρνια, συνοδευμένο από το ντόρο που έκαναν τα ΜΜΕ.

Αν και γράφονται πολλά ακόμη σχετικά με την σχεδόν «μαγική» δυνατότητα της ανάλυσης δεδομένων για επιχειρήσεις, αυτός ο ζήλος δίνει πλέον την θέση του σε ένα πιο σοβαρό ντιμπέιτ που αφορά το που μπορεί αλήθεια να βρεθεί η πραγματική επιχειρηματική αξία. Είναι ξεκάθαρο ότι οι ερευνητές δεδομένων χωρίζονται σε δύο στρατόπεδα: σε αυτούς που «έχουν πολλά» και σε αυτούς που «δεν έχουν ακόμη».

Μια πρόσφατη έρευνα της KPMG έδειξε ότι μόνο το 40% των στελεχών έχουν μεγάλη εμπιστοσύνη στις γνώσεις για τους καταναλωτές σύμφωνα με τα αναλυτικά τους στοιχεία, και οι περισσότεροι είπαν πως τα ανώτερα στελέχη δεν υποστήριζαν πλήρως την τρέχουσα στρατηγική που ακολουθούσαν για την ανάλυση δεδομένων. Το 58% των επιχειρήσεων δήλωσε στη Teradata ότι η επίπτωση της ανάλυσης μεγάλων δεδομένων στα έσοδά τους ήταν «3% ή και μικρότερη». Το πραγματικό κέρδος φαίνεται να περιορίζεται στον τραπεζικό τομέα, στις αλυσίδες εφοδιασμού και στην βελτιστοποίηση των τεχνικών επιδόσεων –δικαιολογημένα μερικές επιχειρήσεις νιώθουν ότι έχουν μείνει πίσω.

Η καθοδήγηση για την χρήση της ανάλυσης δεδομένων στοχεύει σε επιχειρήσεις με τεράστιο προϋπάρχον απόθεμα δεδομένων, οι οποίες επιθυμούν να αποκομίσουν την αξία του- όπως έκαναν αντίστοιχα το ΄49 στην περίοδο του «Πυρετού του Χρυσού» φτάνοντας στην Καλιφόρνια στις αρχές του 1849 για να διεκδικήσουν ένα καλό κομμάτι γης για την αναζήτηση χρυσού. Αυτοί που αγωνίζονται περισσότερο τείνουν να είναι μάρκες που έχουν να κάνουν απευθείας με πελάτες και έμποροι που προσπαθούν να καταλάβουν την συμπεριφορά των πελατών τους κοσκινίζοντας για χρυσό σε ένα ρηχό ρυάκι με συγκεντρωτικά στοιχεία πωλήσεων.

Το πρώτο πράγμα το οποίο πρέπει να αναρωτηθούν αυτοί οι αργοναύτες είναι, εάν υπάρχει πραγματική διαφορά ανάμεσα στην ανάλυση δεδομένων που κάνουν στις μέρες μας και στις παλιές καλές επιχειρηματικές πληροφορίες. Η ευρεία διάδοση των μεγάλων δεδομένων οδήγησε σε μια ανεπαίσθητη αλλαγή στην χρήση της γλώσσας, μέσω τις οποίας κάθε πληροφορία θεωρείται «δεδομένο» και η ανάλυση συχνά σημαίνει απλά «παρατήρηση».

Μπορούν οι άνθρωποι που λαμβάνουν αποφάσεις να βρουν νέες γνώσεις που να οδηγούν σε ενέργειες απλά και μόνο κοιτώντας τα δεδομένα; Παρά τις επανειλημμένες υποσχέσεις που δίνουν οι προμηθευτές για ψήγματα χρυσού δηλαδή διορατικότητα στο τέλος της πορείας ανάλυσης, αξιόπιστα παραδείγματα και λεπτομερείς μελέτες περιπτώσεων λάμπουν δια της απουσίας τους (πρέπει να σημειωθεί ότι αντίστοιχα οι έμποροι έβγαζαν πολλά περισσότερα χρήματα από τους ανθρακωρύχους στον πυρετό του χρυσού -ο πρώτος εκατομμυριούχος ήταν ο Samuel Brannan, ο οποίος πουλούσε εργαλεία αναζήτησης και προμήθειες και ήταν ο πρώτος που διαφήμισε το χτύπημα φλέβας χρυσού τρέχοντας πάνω κάτω στους δρόμους της Καλιφόρνια φωνάζοντας: «Χρυσός, χρυσός στο αμερικανικό ποτάμι!».

Η προσπάθεια να βγουν νέες γνώσεις από μικρά δεδομένα έχει αποδειχτεί επικίνδυνη, σε βαθμό που μπορεί να οδηγήσουν σε λάθος πορεία. Η γνώση ορίζεται ως «η κατανόηση μιας συγκεκριμένης αιτίας και αποτελέσματος μέσα σε συγκεκριμένο συγκείμενο».

Τα δεδομένα δεν μπορούν να δημιουργήσουν γνώση- η γνώση είναι το συμπέρασμα στο οποίο καταλήγουν οι άνθρωποι με βάση τις ενδείξεις. Οι άνθρωποι καταλήγουν σε αυτά τα συμπεράσματα, αλλά με έναν πραγματικά ελαττωματικό τρόπο, επειδή απλά έχουν εξελιχθεί για να ανιχνεύουν μοτίβα παντού.

Βλέπουμε πρόσωπα σε προσόψεις σπιτιών, μυθικά τέρατα σε αστερισμούς και φαντάσματα σε φέτες του τοστ. Αναπόφευκτα καταλήγουμε σε στατιστικά συμπεράσματα που είναι λανθασμένα και δεν μπορούν να διακρίνουν την διαφορά ανάμεσα στο «τυχαίο» ενός διαγράμματος διασποράς και σε μια αναγνωριστική παράταξη γραφημάτων. Αν και ο κόσμος ξέρει ότι η στατιστική συσχέτιση δεν συνεπάγεται αιτιότητα, συμπεριφέρεται συνεχώς σαν αυτό να ισχύει. Όλα αυτά τα χαρακτηριστικά γνωρίσματα δουλεύουν εις βάρος μας όταν εξετάζονται δεδομένα.

Τι συμβαίνει με την μηχανική μάθηση λοιπόν; Μπορούν οι ανόητες μηχανές, που δεν έχουν την νοημοσύνη που πλήττει τους ανθρώπους, να ανακαλύψουν μέσα στα δεδομένα αιτιώδεις σχέσεις τις οποίες το μικρό μας μυαλό αδυνατεί να υπολογίσει; Όπως πάντα, ως επιχείρηση, ανακαλύψαμε πως η απάντηση είναι ναι, αλλά ενώ τα προγνωστικά μοντέλα μπορούν αξιόπιστα να προβλέψουν και να προσομοιώσουν γεγονότα, η πολυπλοκότητά τους εμποδίζει την εύκολη ερμηνεία.

Για τις περισσότερες επιχειρήσεις η χρήση της πρόβλεψης δεν έχει σημασία. Ως συνήθως παρατηρήθηκε πως η προσέγγιση της πρόβλεψης και της προσομοίωσης, ειδικότερα για λόγους μάρκετινγκ, άφηνε ανεκπλήρωτη την θεμελιώδη ανάγκη που πρέπει να κατανοήσουν οι μάρκες, δηλαδή να καταλαβαίνουν τους πελάτες τους και το πως να επικοινωνούν μαζί τους. Στην πραγματικότητα υπάρχουν διαθέσιμες πλατφόρμες στην αγορά, οι οποίες εφαρμόζουν μηχανική μάθηση σε ένα ιδιαίτερα μεγάλο «κοίτασμα ορυχείου» στο οποίο μπορεί να έχει πρόσβαση κάθε επιχείρηση. Ωστόσο μέχρι πρόσφατα θεωρούταν αδύνατη η εκμετάλλευση του.

Αυτές οι πλατφόρμες χρησιμοποιούν την φυσική γλώσσα των κειμένων, που δημιουργούν εκατομμύρια άνθρωποι στα μέσα κοινωνικής δικτύωσης , στα μπλοκ και στα φόρουμ συζητήσεων, και τα μετατρέπουν σε «σημεία δεδομένων» τα οποία μπορούν να ομαδοποιηθούν, να φιλτραριστούν και να διαμορφωθούν όπως και τα ποσοτικά δεδομένα.

Αυτό είναι ένα πολύ μεγάλο βήμα στην εποχή των μεγάλων δεδομένων- η χρήση δηλαδή τεχνικών βαθιάς μάθησης όπως τα νευρωνικά δίκτυα για την επίτευξη της μεταμόρφωσης των «αδόμητων» δεδομένων (φυσική γλώσσα, εικόνες, ήχος και βίντεο) σε μορφή που μπορεί να χρησιμοποιηθεί. Είναι πλέον εφικτή η συλλογή πληροφοριών από online συνομιλίες και η διαμόρφωσή τους με την χρήση συγκεκριμένων επιστημονικών τεχνικών δεδομένων, ώστε να ενημερωθούν οι έμποροι για το ποια ακριβώς θέση έχει η μάρκα τους στο μυαλό των καταναλωτών, για το τι είδους γεγονότα και συναισθήματα έχουν συνδέσει με ένα προϊόν και για να δοθεί μια πραγματική αντίληψη για το πώς βλέπει το συγκεκριμένο κοινό την μάρκα.

Είναι δυνατή η αναγνώριση ξεχωριστών κοινοτήτων που συζητούν για ένα θέμα στα μέσα κοινωνικής δικτύωσης, του οδηγούς της μαζικής τους προσοχής καθώς και το ποιος επηρεάζει αυτούς που επηρεάζονται. Τελικά εφόσον επεξεργασθούν τα δεδομένα της συζήτησης με αυτόν τον τρόπο, μπορούν να χρησιμοποιηθούν αλγόριθμοι για να αναγνωρίσουν τις online τάσεις που ακολουθούν την πορεία των πραγματικών γεγονότων.

Τα μοντέλα αυτά χρησιμοποιούνται από εμπόρους για να ανακαλύψουν τις αναδυόμενες καταναλωτικές τάσεις χρόνια πριν εμφανιστούν σε έρευνες αγοράς, για να τεστάρουν νέες ιδέες προϊόντων και να καθορίσουν το καλύτερο αντίγραφο για διαφημιστικά υλικά.

Το πιο σημαντικό είναι ότι η εξόρυξη των δεδομένων του ιστού με αυτόν τον τρόπο δίνει σε μάρκες όπως τράπεζες και εταιρίες διαδικτύου την ευκαιρία να απολαμβάνουν τις ίδιες ανταμοιβές από την προώθηση της ανάλυσης μεγάλων δεδομένων, χωρίς να θυσιάζουν την αντίληψη στο βωμό της αυτοματοποίησης. Για τους εμπόρους που πεινάνε για δεδομένα αυτή είναι η φλέβα χρυσού.

Πηγή: econsultancy.com