18 Δεκέμβριος 2017

Τα μαθήματα της ταινίας Moneyball για τις αναλύσεις Big data

Πολύ πριν οι αναλύσεις "Big Data" γίνουν “cool”, ο Paul DePodesta τις είχε χρησιμοποιήσει σε μεγάλα πρωταθλήματα.

Σε μία φάση της καριέρας του DePodesta  απεικονίζεται στην ταινία "Moneyball". Η ταινία είναι βασισμένη στο best-seller βιβλίο του Michael Lewis (2003), όπου ο Michael Lewis εξιστορεί την αναζωπύρωση της ομάδας μπέιζμπολ Oakland A’s, η οποία είχε οργανωθεί  από τον γενικό διευθυντή της A’s  Billy Beane και το DePodesta, ο οποίος χρησιμοποίησε τις αναλύσεις  για να προσδιορίσει ποιοι είναι οι υποτιμημένοι παίκτες.

Ο χαρακτήρας βασίζεται στον DePodesta που έχει μετονομαστεί σε Peter Brand και τον ρόλο παίζει ο Jonah Hill.

Σε μια παρουσίαση στη Strata Summit στη Νέα Υόρκη, ο DePodesta, ο οποίος είναι τώρα Αντιπρόεδρος Ανάπτυξης Παικτών στους New York Mets, έκανε μια παρουσίαση του ρόλου της ανάλυσης των επιδόσεων στο μπέιζμπολ που μπορούν να εφαρμοστούν σε οργανισμούς που βασίζονται σε δεδομένα. Όταν έφτασε στο Oakland, ο DePodesta υπενθύμισε ότι μικρές οι ομάδες  της αγοράς, όπως η A’s με περιορισμένους προϋπολογισμούς βρέθηκαν να έχουν λιγότερα εφόδια σε μια κατάσταση προκλητικού ανταγωνισμού με πλουσιότερες ομάδες της αγοράς όπως η Νέα Υόρκη και η Βοστώνη.

“Έπρεπε να βρούμε ένα διαφορετικό τρόπο”, δήλωσε ο DePodesta.

Δεδομένα εναντίον της υποκειμενικότητας του scouting των παικτών

Η λύση που αγκαλιάστηκε από τον Beane και τον DePodesta επηρεάστηκε από μια στατιστική ανάλυση της σχολής μπέιζμπολ γνωστή ως sabermetrics (αναφορά στο Society for American Baseball Research), το οποίο ερχόταν συχνά σε αντίθεση με τις παραδοσιακές μεθόδους scouting των παικτών.

“Η υποκειμενικότητα κυβερνούσε στην αξιολόγηση των παικτών", είπε. "Είχαμε ένα εντελώς νέο σύνολο μετρήσεων που δεν είχε καμία ομοιότητα με αυτά που είχαμε δει μέχρι τώρα. Εμείς δεν βρήκαμε την λύση του μπέιζμπολ. Αλλά μειώσαμε την αναποτελεσματικότητα της λήψης των αποφάσεών μας”.

Μιλώντας σε ένα πλήθος στελεχών και επιστημόνων των δεδομένων, ο DePodesta συζήτησε τη διαδικασία λήψης αποφάσεων με γνώμονα τα δεδομένα, και πώς να αποφύγουν τα λάθη των αναλύσεων που θα μπορούσαν να οδηγήσουν σε κακά συμπεράσματα. Σε πολλές περιπτώσεις, η πρόκληση είναι να υπάρξει μια σαφής άποψη για τα δεδομένα- η οποία συχνά περιλαμβάνει φιλτράρισμα συναισθηματικών αντιδράσεων όσον αφορά τα δεδομένα και τις επιδόσεις των παικτών.

«Επιδιώκουμε συνεχώς αιτιώδεις σχέσεις, και μπορούμε να εξαπατηθούμε από αυτές", δήλωσε ο DePodesta. "Συχνά συνδεόμαστε στενά με κάποια πράγματα, και δεν ξέρω γιατί γίνεται αυτό."

Κοινή μεροληψία στην Ανάλυση Δεδομένων

Είναι εύκολο να αναπτύξεις ένα “σφάλμα επιβεβαίωσης”, δήλωσε ο DePodesta. «Από τη στιγμή που έχουμε κάτι στο μυαλό μας, αντιστεκόμαστε στις πληροφορίες που δεν συμφωνούν με το συμπέρασμα μας”, είπε.

Ένα ιδιαίτερο πρόβλημα στο μπέιζμπολ είναι "μεροληψία εμφάνισης” - η αντίληψη ότι κάποιοι αθλητές μοιάζουν περισσότερο με πολύ καλούς παίκτες του μπέιζμπολ σε σχέση με άλλους. Είναι επίσης ένα ζήτημα στην επιχείρηση, ο DePodesta δήλωσε, αναφέροντας δεδομένα του Malcolm Gadwell για το ύψος και την επιτυχία των επιχειρήσεων. Ο Gadwell διαπίστωσε ότι αν και μόλις 3,9 τοις εκατό των αμερικανικών ανδρών έχουν ύψος 6,2 πόδια ή και περισσότερο από αυτό, περίπου το 30% στο Fortune 500 CEOs έχουν ύψος 6,2 πόδια και πάνω.

Για να ληφθούν οι σωστές αποφάσεις έπρεπε να ληφθούν υπόψιν αυτές οι μεροληψίες.

"Χρησιμοποιούμε τα δεδομένα, όπως τον φακό μας στο σπήλαιο - καθοδηγώντας το φως," δήλωσε ο DePodesta. “Έπρεπε να ήμασταν απολύτως αμείλικτοι, κάνοντας τις αφελείς ερωτήσεις. Το μόνο πράγμα που ήταν σίγουρο  ήταν η ιδέα του να είσαι ανοιχτόμυαλος” .

Πηγή: datacenterknowledge.com