18 Δεκέμβριος 2017

Η Google χρησιμοποιεί τεχνητή νοημοσύνη για να συμπιέσει εικόνες καλύτερα από το JPEG

Το μέγεθος παίζει πολύ σημαντικό ρόλο όταν έχουμε να κάνουμε με δεδομένα πολυμέσων. Οι συμπιεσμένες εικόνες είναι πολύ ευκολότερο να μεταφερθούν και να αποθηκευτούν από τις μη συμπιεσμένες και τώρα η Google χρησιμοποιεί Νευρωνικά Δίκτυα για να ανταγωνιστεί το JPEG στο παιχνίδι της συμπίεσης.

 

 

Η Google ξεκίνησε παίρνοντας τυχαίο δείγμα από 6 εκατομμύρια 1.280x720 εικόνες από το ίντερνετ. Ο στόχος της Google είναι να βελτιώσει την επίδοση σε δεδομένα που είναι πολύ δύσκολο να συμπιεστούν. Τελικός στόχος είναι να βελτιώσει την επίδοση της συμπίεσης σε όλους τους τύπους δεδομένων και αφού πετύχουν στα δύσκολα ως προς τη συμπίεση δεδομένα, θα είναι εύκολο να πετύχουν στα υπόλοιπα.

 

Οι ερευνητές χρησιμοποίησαν το TensorFlow, το open-source σύστημα μηχανικής μάθησης της Google, για να εκπαιδεύσουν ένα σετ από πειραματικές αρχιτεκτονικές νευρωνικών δικτύων. Χρησιμοποιήσαν ένα εκατομμύριο βήματα για να τα εκπαιδεύσουν. Με τη συλλογή μια σειράς από τεχνικές μετρήσεις βρήκαν ποια μοντέλα παράγουν τα καλύτερα αποτελέσματα ως προς τη συμπίεση.

Στο τέλος, το μοντέλο της Google ξεπέρασε, κατά μέσο όρο, τις στάνταρ επιδόσεις του JPEG. Η επόμενη πρόκληση, όπως είπαν οι ερευνητές της Google, είναι να νικήσουν τις μεθόδους συμπίεσης που προέρχονται από τα codecs συμπίεσης για βίντεο σε μεγάλες εικόνες.

 

Όμως, οι ερευνητές σημείωσαν πως δεν είναι πάντα εύκολο να ορίσεις τον νικητή όταν αναφερόμαστε σε επιδόσεις συμπίεσης, γιατί οι τεχνικές μετρήσεις δεν συμφωνούν πάντα με την οπτική γωνία των ανθρώπων. Ένα paper που περιγράφει τη δουλειά της ομάδας της Google δημοσιεύθηκε την προηγούμενη βδομάδα.

Src: http://arxiv.org/pdf/1608.05148v1.pdf