Η μετατροπή κειμένου σε ήχο είναι εδώ: Μια από τις επόμενες μεγάλες ανατροπές της τεχνητής νοημοσύνης θα μπορούσε να είναι στη μουσική βιομηχανία

Περίληψη άρθρου:
Τα τελευταία χρόνια, η Τεχνητή Νοημοσύνη (ΤΝ) έχει εφαρμοστεί σε δημιουργικούς τομείς όπως η δημιουργία εικόνων και κειμένων και τώρα η μουσική. Την περασμένη εβδομάδα, η Google κυκλοφόρησε το MusicLM, μια γεννήτρια μουσικής βασισμένη στην Τεχνητή Νοημοσύνη που μπορεί να μετατρέψει προτροπές κειμένου σε ηχητικά τμήματα. Τα εργαλεία τεχνητής νοημοσύνης επιτρέπουν στους χρήστες να δημιουργούν αυτόματα μουσικές ακολουθίες ή ηχητικά τμήματα, όπως η συνέχεια και η εναρμόνιση. Η Τεχνητή Νοημοσύνη μπορεί επίσης να χρησιμοποιηθεί για τον μετασχηματισμό μιας μουσικής ακολουθίας ή ενός τμήματος ήχου, όπως με την τεχνολογία βιβλιοθήκης Differentiable Digital Signal Processing της Google Magenta. Επιπλέον, η Τεχνητή Νοημοσύνη μπορεί να χρησιμοποιηθεί για τον διαχωρισμό πηγής, δηλαδή το σπάσιμο μιας ηχητικής εγγραφής ενός κομματιού στα ξεχωριστά του όργανα. Νεοσύστατες επιχειρήσεις όπως η Endel και η Aimi διερευνούν τη λειτουργική μουσική και τις διαδραστικές ροές, αντίστοιχα. Η χρήση της τεχνητής νοημοσύνης στη μουσική δημιουργεί πολλά ερωτήματα σχετικά με τους νόμους περί πνευματικών δικαιωμάτων και τον τρόπο με τον οποίο οι μουσικοί θα χρησιμοποιούν την τεχνητή νοημοσύνη στο μέλλον. Η αλλαγή είναι σίγουρη και μια νέα γενιά μουσικών θα βρει νέους τρόπους εργασίας με αυτά τα εργαλεία.
Αναλυτικά το άρθρο:
Το MusicLM είναι ένα βήμα προς αυτή την κατεύθυνση και ήδη παράγει εντυπωσιακά αποτελέσματα.
Τα τελευταία χρόνια, η Τεχνητή Νοημοσύνη (ΤΝ) έχει εφαρμοστεί σε δημιουργικούς τομείς όπως η δημιουργία εικόνων και κειμένων με εντυπωσιακά αποτελέσματα. Την περασμένη εβδομάδα, η Google κυκλοφόρησε το MusicLM, μια γεννήτρια μουσικής βασισμένη στην Τεχνητή Νοημοσύνη που μπορεί να μετατρέψει προτροπές κειμένου σε ηχητικά τμήματα.
Πρόκειται για ένα σημαντικό βήμα προς τα εμπρός στη χρήση της ΤΝ στη μουσική βιομηχανία, η οποία εξακολουθεί να προσαρμόζεται στις διαταραχές που προκαλούνται από το διαδίκτυο και τις υπηρεσίες streaming.
Το MusicLM παράγει ήδη εντυπωσιακά αποτελέσματα, δείχνοντας τον ταχύτατο ρυθμό της καινοτομίας στη δημιουργική τεχνητή νοημοσύνη.
Αυτοματοποίηση της δημιουργίας μουσικής
Τα εργαλεία δημιουργίας μουσικής τεχνητής νοημοσύνης γίνονται όλο και πιο δημοφιλή, επιτρέποντας στους χρήστες να δημιουργούν αυτόματα μουσικές ακολουθίες ή τμήματα ήχου.
Η εργαλειοθήκη Magenta της Google είναι ένα από τα πιο δημοφιλή εργαλεία ελεύθερου και ανοικτού κώδικα. Η παραγωγή μουσικής AI μπορεί να χρησιμοποιηθεί για τη συνέχιση, όπου η AI συνεχίζει μια ακολουθία νοτών ή δεδομένων κυματομορφής, ή την εναρμόνιση ή τη συνοδεία, όπου η AI παράγει κάτι που συμπληρώνει την είσοδο.
Εταιρείες όπως η Boomy και η Aiva αναπτύσσουν πλατφόρμες τεχνητής νοημοσύνης για τη δημιουργία μουσικής, επιτρέποντας στους χρήστες να δημιουργήσουν ένα τραγούδι με μερικά κλικ ή να επεξεργαστούν τη μουσική που παράγεται νότα προς νότα.
Ωστόσο, οι τεχνικές μηχανικής μάθησης είναι δύσκολο να ελεγχθούν, γεγονός που καθιστά δύσκολη την πρόβλεψη του αποτελέσματος της χρήσης αυτών των εργαλείων.
Νέοι τρόποι χειρισμού του στυλ και του ήχου
Τα εργαλεία τεχνητής νοημοσύνης επιτρέπουν πλέον στους μουσικούς να εξερευνούν νέα ηχοτοπία και να δημιουργούν μουσική που ήταν προηγουμένως αδύνατη. Η σύνθεση μουσικής με τη βοήθεια της τεχνητής νοημοσύνης γίνεται όλο και πιο δημοφιλής, με την τεχνολογία της βιβλιοθήκης Differentiable Digital Signal Processing της Google Magenta να πρωτοπορεί.
Αυτή η τεχνολογία επιτρέπει στους χρήστες να μετασχηματίζουν μια μουσική ακολουθία ή ένα τμήμα ήχου αλλάζοντας το ηχόχρωμά του, δημιουργώντας εντελώς νέους ήχους.
Αυτό επιδείχθηκε στον πρώτο διαγωνισμό τραγουδιού AI, όπου το μουσικό στούντιο Uncanny Valley με έδρα το Σίδνεϊ χρησιμοποίησε τη μεταφορά ηχοχρώματος για να φέρει στη μίξη τα κοάλα που τραγουδούν.
Η σύνθεση μουσικής με τη βοήθεια της τεχνητής νοημοσύνης γίνεται όλο και πιο δημοφιλής και είναι πιθανό να συνεχίσει να φέρνει επανάσταση στη μουσική βιομηχανία.
Ξεχωρίζοντας τη μουσική
Ο διαχωρισμός πηγών με τεχνητή νοημοσύνη έχει προχωρήσει πολύ τα τελευταία χρόνια, επιτρέποντας στους DJs και τους καλλιτέχνες mashup έναν άνευ προηγουμένου έλεγχο στον τρόπο με τον οποίο αναμιγνύουν και αναμειγνύουν κομμάτια.
Αυτό θα μπορούσε να προσφέρει νέες πηγές εσόδων για τους καλλιτέχνες που επιτρέπουν την ευκολότερη προσαρμογή της μουσικής τους, αλλά μπορεί επίσης να ανοίξει ένα κουτί της Πανδώρας με ζητήματα πνευματικών δικαιωμάτων.
Οι καλλιτέχνες ίσως χρειαστεί να αποδεχτούν αυτή την τεχνολογία, όπως συνέβαινε όταν πρωτοεμφανίστηκαν τα συνθεσάιζερ και τα ντραμ μασίν.
Ωστόσο, οι νόμοι περί πνευματικών δικαιωμάτων προσφέρουν στους καλλιτέχνες προστασία από τη μη εξουσιοδοτημένη χειραγώγηση της δουλειάς τους, οπότε αυτό είναι πιθανό να γίνει άλλη μια γκρίζα ζώνη στη μουσική βιομηχανία, την οποία οι κανονισμοί ενδέχεται να δυσκολευτούν να αντιμετωπίσουν.
Νέες μουσικές εμπειρίες
Η πρόσφατη δημοτικότητα των λιστών αναπαραγωγής αποκάλυψε ότι οι άνθρωποι απολαμβάνουν να ακούν μουσική που έχει λειτουργικό σκοπό, όπως να τους βοηθά να συγκεντρωθούν, να χαλαρώσουν, να αποκοιμηθούν ή να γυμναστούν.
Η Endel είναι μια νεοσύστατη επιχείρηση που έχει κάνει επιχειρησιακό της μοντέλο τη λειτουργική μουσική με τεχνητή νοημοσύνη, δημιουργώντας άπειρες ροές που βοηθούν στη μεγιστοποίηση ορισμένων γνωστικών καταστάσεων. Η μουσική της Endel μπορεί να συνδεθεί με φυσιολογικά δεδομένα, όπως ο καρδιακός ρυθμός.
Άλλες νεοφυείς επιχειρήσεις, όπως η Aimi, εξερευνούν τη λειτουργική μουσική επιτρέποντας στους ακροατές να χειρίζονται τις παραμέτρους παραγωγής του συστήματος.
Η τεχνητή νοημοσύνη πιθανόν να παίζει ρόλο σε αυτές τις εφαρμογές και αυτές οι εξελίξεις καθοδηγούν τα οράματα των εταιρειών για το πώς θα μπορούσε να εξελιχθεί η μουσική εμπειρία στο μέλλον.
Το μέλλον της μουσικής
Η εισαγωγή της τεχνητής νοημοσύνης στη μουσική βιομηχανία προκάλεσε σύγκρουση μεταξύ παγιωμένων συμβάσεων, νόμων και πολιτιστικών αξιών.
Προκύπτουν ερωτήματα όπως το κατά πόσον οι νόμοι περί πνευματικών δικαιωμάτων θα αυστηροποιηθούν για να διασφαλιστεί ότι οι εταιρείες που εκπαιδεύουν συστήματα τεχνητής νοημοσύνης στα έργα των καλλιτεχνών θα αποζημιώνουν τους καλλιτέχνες αυτούς και ποια θα είναι η αποζημίωση.
Δεν είναι βέβαιο πώς αυτό θα επηρεάσει τον χρόνο που αφιερώνουν οι μουσικοί για τη δημιουργία μουσικής ή αν θα οδηγήσει στη δημιουργία περισσότερης μουσικής. Η αλλαγή είναι αναπόφευκτη καθώς μια νέα γενιά μουσικών εξοικειώνεται περισσότερο με τις δημιουργικές δυνατότητες της Τεχνητή Νοημοσύνη.
Αυτή η αναταραχή δεν είναι κάτι καινούργιο στην ιστορία της μουσικής τεχνολογίας και εναπόκειται σε εμάς να αποφασίσουμε πώς θα χρησιμοποιήσουμε αυτά τα ισχυρά εργαλεία για να διαμορφώσουμε το δημιουργικό μας μέλλον.
Πηγή: Text-to-audio generation is here: One of the next big AI disruptions could be in the music industry
