14 Δεκέμβριος 2017

Τα πιο φιλικά προς το χρήστη, δωρεάν Text Analytics λογισμικά

Τα καλά νέα για τα open source εργαλεία για text analytics είναι ότι υπάρχουν πολλά από αυτά. Από τη άλλη, κάποια από αυτά απαιτούν κάποιον γλωσσολόγο για να μπορέσεις να δουλέψεις μαζί τους. Για αυτό το λόγο, εστιάζουμε και παρουσιάζουμε τα εργαλεία που ο μέσος χρήστης μπορεί να εγκαταστήσει και να λειτουργήσει γρήγορα. Χωρίς αλγόριθμους ή γνώσεις προγραμματισμού. Σίγουρα θα χρειαστεί να παρακολουθήσεις πολλά μαθήματα στο Youtube.

RapidMiner + AYLIEN
Το Rapid Miner είναι ένα δωρεάν, open source λογισμικό για data science, συμπεριλαμβανομένων data mining, text mining, predictive analytics και πολλά άλλα. Οι δυνατότητες επεκτείνονται με τις πολλές προεκτάσεις που μπορείς να βρεις και να εγκαταστήσεις, πολλές επίσης δωρεάν.

Πέρα από την δική του προέκταση για text analytics, που περιέχει πολλά και χρήσιμα εργαλεία για text analytics, προ επεξεργασία κλπ, που μπορούν να συνδυαστούν με τους αλγόριθμους μηχανικής μάθησης, το Rapid Miner έχει την επέκταση από την εταιρεία AYLIEN που ειδικεύεται στη sentiment analysis αλλά και άλλες λειτουργίες επεξεργασίας κειμένου, όπως language detection, topic detection και πολλά άλλα.

Συνοψίζοντας, το RapidMiner είναι το πιο εύκολο στη χρήση και έχει ολοκληρωμένη εργαλειοθήκη για text analytics, text mining. Καλύπτει από την εισαγωγή δεδομένων από διάφορες πηγές έως προχωρημένες τεχνικές όπως sentiment analysis. Η δωρεάν έκδοση αναλύει έως 10.000 γραμμές κειμένου, με την επί πληρωμή έκδοση να είναι απεριόριστη.

KNIME Analytics Platform
Σαν το RapidMiner, το Knime είναι πολύ καλό εργαλείο, δωρεάν, δεν απαιτεί γνώση κώδικα και έχει μια αρκετά καλή εργαλειοθήκη για text analytics. Έχει παρόμοιο περιβάλλον με το RapidMiner, φιλικό στον μέσο χρήστη που θέλει να κάνει τη δουλειά του γρήγορα και χωρίς να χρειάζεται βοήθεια από κάποιον τρίτο.

Σε σύγκριση με το RapidMiner, το Knime φαίνεται να έχει πιο δύσκολη χρήση, παρά τις ομοιότητες. Ακόμα, το RapidMiner δίνει αυτόματες προτάσεις και συμβουλές όταν κάτι δεν πάει καλά με τη διαδικασία που κάνεις. Το βασικότερο όμως είναι ότι προσφέρει περισσότερες λύσεις ως προς την επεξεργασία κειμένου και την sentiment analysis.

Από την άλλη, η δωρεάν έκδοση του Knime προσφέρει πιο πολλές δυνατότητες στην επεξεργασία δεδομένων από την δωρεάν έκδοση του RapidMiner. Ακόμα, δεν υπάρχει περιορισμός στις γραμμές που μπορείς να επεξεργαστείς στην δωρεάν έκδοση του Knime.

Συνοψίζοντας, κάποιος που είναι εξοικειωμένος με χρήση τέτοιων λογισμικών θα μπορεί να χρησιμοποιήσει και τα δύο εργαλεία εύκολα και θα πρέπει να δοκιμάσει και τα δύο για να αποφασίσει πιο από τα δύο είναι «καλύτερο» για τη δουλειά του. Οι νεοεισερχόμενοι θα ήταν καλύτερα να ξεκινήσουν με το RapidMiner καθώς είναι πιο εύκολο να το μάθει κανείς αλλά έχει πιο πολλές διαθέσιμες πηγές (λογικό αφού υπάρχει περισσότερο καιρό).

Φυσικά υπάρχουν και άλλα εργαλεία, αλλά επειδή στοχεύουν σε πιο εξειδικευμένα προβλήματα των text analytics δεν τα αναλύουμε. Κάποια από αυτά είναι το Open Calais, το AntWordProfiler, το Grab Bag και άλλα πολλά. Ακόμα, το AYLIEN μπορεί κανείς να το βρει και στα Google Sheets add-on. Σίγουρα, τα text analytics είναι ακόμα στην αρχή και θα δούμε μεγάλη πρόοδο στο μέλλον, κάτι που φαίνεται και από τις beta εκδόσεις λογισμικών που υπάρχουν διαθέσιμες. Το ζήτημα είναι ότι με τα εργαλεία που παρουσιάσαμε, ο μέσος χρήστης μπορεί να εφαρμόσει τεχνικές text analytics χωρίς να χρειάζεται να γνωρίζει κώδικα ή να έχει ισχυρό μαθηματικό υπόβαθρο.

Πηγή: softwareadvice.com