12 Δεκεμβρίου 2017

Τα Big Data έχουν πρόβλημα εξάντλησης

Τι θα μπορούσαμε να κάνουμε με τα δεδομένα μας; Ίσως να την έχετε ξανακούσει ή ξαναθέσει αυτήν την ερώτηση. Είναι πολύ συνηθισμένη τώρα πια, παραπροϊόν του αυξανόμενου ενδιαφέροντος – ή και πάθους για κάποιους - για τα big data και την επιστήμη των δεδομένων.

 

 

 

Δυστυχώς, δεν είναι η σωστή ερώτηση, αναφέρει ο Steve Weber, καθηγητής πληροφορικής στο Πανεπιστήμιο της Καλιφόρνιας, επικεφαλής του προγράμματος επιστήμης δεδομένων. «Μια καλύτερη ερώτηση θα ήταν: τι ακριβώς χρειάζονται και επιθυμούν οι πελάτες;» ανέφερε στην Information Week. «Και έπειτα: Τι δεδομένα πρέπει να συλλέξω, και τι θα χρειαστεί να κάνω για να το πετύχω αυτό;»

 

Μπορεί να ακούγονται σαν προφανή ζητήματα, παραδέχεται ο Weber, αλλά η πραγματιστική προσέγγιση των οργανισμών αφοσιωμένων στα big data τα παραβλέπει. «Όταν ξεκινά κανείς να ασχολείται με τα δεδομένα, είναι σαν να βάζει το κάρο πριν το άλογο», ανέφερε. «Είναι μια εμμονή με τα εργαλεία, με την εξάντληση των δεδομένων. Ψάχνει κανείς ψύλλους στα άχυρα». Είναι πιο ουσιαστικό να ξεκινήσει κανείς με ποιο ουσιώδεις επιχειρηματικές ερωτήσεις. Για παράδειγμα: Τι υπηρεσίες ή προϊόντα πρέπει να παρέχω στους πελάτες μου, αλλά δεν μπορώ σήμερα; Και έπειτα: Τι δεδομένα πρέπει να σχεδιάσω;

 

«Η τεχνολογία αναπτύσσεται και ξαφνικά όλοι θέλουν να βρουν τη θέση τους πριν μάθουν τι ακριβώς πρέπει να κάνουν. Μπορείς να το κάνεις, αλλά δεν είμαι σίγουρος αν είναι αυτός ο πιο αποτελεσματικός τρόπος.» Οπαδοί της Hadoop, παρακαλώ σημειώστε: Δεν είναι καλό να ασχολείστε μόνο με μια συγκεκριμένη πλατφόρμα ή εργαλείο big data. «Η Hadoop παρέχει τέλεια λογισμικά, μια τέλεια πλατφόρμα, αλλά δεν είναι η μοναδική. Είναι απλά η πρώτη. Όλο και περισσότεροι ξεκινούν να δημιουργούν εργαλεία για την πρόσβαση όλων στις εργασίες με big data.»

 

Η αναλογία διαδικτύου μπορεί να εφαρμοστεί εδώ. «Όταν ξεκίνησε το διαδίκτυο, η εγγραφή των HTML ήταν πολύ περίπλοκη. Τώρα πια δεν χρειάζεται καν να ξέρουμε τοHTML για να δημιουργήσουμε μια ιστοσελίδα». Και για την δημοκρατικοποίηση της περίπλοκης τεχνολογίας, αυτή μπορεί να γίνεται ακόμη πιο γρήγορα στον χώρο τωνbig data. Όπως αναφέρει ο Weber: Η Hadoop είναι καλή, αλλά αν ποντάρεις σε αυτή μακροπρόθεσμα, μάλλον θα εκπλαγείς.

 

Ενός είδους ανάπτυξη των big data που ο Weber βρίσκει «εξαιρετικά συναρπαστική» είναι το Διαδίκτυο των Πραγμάτων, ή όπως το αποκαλεί αυτός, «κόσμος των πολύ φθηνών αισθητήρων». «Φορώ αισθητήρες και με ό,τι έχω διάδραση, αυτό γίνεται όργανο με κάποιο τρόπο. Στην αρχή είναι κανείς διστακτικός, για το αν μπορεί να τα καταφέρει, αλλά και λόγω του άπειρου αριθμού πραγμάτων που μπορούμε να κάνουμε με τα δεδομένα».

 

Αυτό εξαρτάται βέβαια από το αν συλλέγονται και αναλύονται οι πληροφορίες, ιδανικά από μέρη με σωστούς σκοπούς. «Οι άνθρωποι χρησιμοποιούν πολλές φορές τον όρο «εξάντληση δεδομένων» για όλα τα δεδομένα που η διάδρασή τους με τον κόσμο δεν φέρνει πολλά αποτελέσματα, και πολύ λίγα από αυτά συλλέγονται, ανέφερε ο Weber.