SARAH ROGERS/MITTIR | GETTY

L’addestramento di modelli IA per la musica sta per diventare molto costoso

Le case discografiche stanno facendo causa a due startup leader nel settore dell’intelligenza artificiale e, secondo quanto riferito, stanno esplorando un accordo di licenza con YouTube: azioni che determineranno il futuro della musica basata sull’intelligenza artificiale, e se ne esisterà uno.

La musica AI si trova improvvisamente in un momento di rottura. Il 24 giugno, Suno e Udio, due startup leader nel settore dell’AI musicale che producono strumenti in grado di generare canzoni complete a partire da un prompt in pochi secondi, sono state citate in giudizio dalle principali case discografiche per una diffusa violazione del copyright. Sony Music, Warner Music Group e Universal Music Group sostengono che le società hanno utilizzato musica protetta da copyright nei loro dati di addestramento “su una scala quasi inimmaginabile”, consentendo ai modelli di intelligenza artificiale di generare canzoni che “imitano le qualità delle registrazioni sonore umane autentiche”.

Due giorni dopo, il Financial Times ha riportato la notizia che YouTube sta perseguendo un approccio relativamente trasparente. Piuttosto che addestrare modelli musicali di intelligenza artificiale su serie di dati segreti, l’azienda starebbe offrendo somme forfettarie non specificate alle migliori etichette discografiche in cambio di licenze per l’utilizzo dei loro cataloghi per l’addestramento.

In risposta alle cause, sia Suno che Udio hanno rilasciato dichiarazioni in cui menzionano gli sforzi per garantire che i loro modelli non imitino opere protette da copyright, ma nessuna delle due società ha specificato se i loro set di addestramento li contengano. Udio ha dichiarato che il suo modello “ha ‘ascoltato’ e imparato da un’ampia collezione di musica registrata”, mentre due settimane prima delle cause, l’amministratore delegato di Suno, Mikey Shulman, mi ha detto che il suo set di addestramento è “sia standard di settore che legale”, ma che la ricetta esatta è proprietaria.

Sebbene il terreno si stia muovendo velocemente, nessuna di queste mosse dovrebbe sorprendere più di tanto: le battaglie contro i dati di addestramento sono diventate una sorta di diritto di passaggio per le aziende di IA generativa. La tendenza ha portato molte di queste aziende, tra cui OpenAI, a pagare per accordi di licenza mentre le cause si svolgono.

Tuttavia, la posta in gioco di una battaglia sui dati di addestramento per la musica AI è diversa da quella dei generatori di immagini o dei chatbot. Le aziende di IA generativa che lavorano su testi o foto hanno la possibilità di aggirare le cause legali, anche mettendo insieme corpus open-source per addestrare i modelli. Per contro, il dominio pubblico della musica è molto più limitato (e non è esattamente quello che la maggior parte delle persone vuole ascoltare).

Altre aziende di IA possono anche concludere più facilmente accordi di licenza con gli editori e i creatori interessati, che sono molti; ma i diritti sulla musica sono molto più concentrati di quelli su film, immagini o testi, dicono gli esperti del settore. Sono in gran parte gestiti dalle tre maggiori etichette discografiche – i nuovi querelanti – i cui bracci editoriali possiedono collettivamente più di 10 milioni di canzoni e gran parte della musica che ha definito il secolo scorso. (Il documento cita un lungo elenco di artisti che le etichette sostengono siano stati ingiustamente inclusi nei dati di formazione, dagli ABBA a quelli della colonna sonora di Hamilton).

Inoltre, è più difficile creare musica che valga la pena di essere ascoltata: generare una poesia leggibile o un’illustrazione passabile con l’intelligenza artificiale è una sfida tecnica, ma infondere in un modello il gusto necessario per creare musica che ci piace è un’altra.

Naturalmente è possibile che le aziende di IA vincano la causa e che tutto questo non abbia importanza; avrebbero carta bianca per allenarsi su un secolo di musica protetta da copyright. Ma gli esperti sostengono che il caso delle etichette discografiche è forte ed è più probabile che le aziende di IA debbano presto pagare – e pagare molto – se vogliono sopravvivere. Se un tribunale dovesse stabilire che le aziende di musica artificiale non possono esercitarsi gratuitamente sui cataloghi di queste etichette, allora costosi accordi di licenza, come quello che YouTube starebbe perseguendo, sembrerebbero essere l’unica strada percorribile. In questo modo si garantirebbe che l’azienda con le tasche più profonde finisca in cima alla classifica.

Più di qualsiasi altro caso relativo ai dati di addestramento, l’esito di questo caso determinerà la forma di una grande fetta di IA – e se ci sarà un futuro per essa.

Il merito del caso

Il generatore musicale di Suno è stato reso pubblico da meno di un anno, ma l’azienda ha già raccolto 12 milioni di utenti, un round di finanziamento da 125 milioni di dollari il mese scorso e una partnership con Microsoft Copilot. Udio è un’azienda ancora più recente, lanciata in aprile con 10 milioni di dollari di finanziamento iniziale da parte di musicisti-investitori come will.i.am e Common.

Le case discografiche sostengono che entrambe le startup stanno violando il diritto d’autore per quanto riguarda l’addestramento e l’output dei loro modelli.

“I querelanti hanno le migliori probabilità di chiunque altro di fare causa a un’azienda di IA”, afferma James Grimmelmann, professore di diritto digitale e dell’informazione alla Cornell Law School. Grimmelmann fa un paragone con la causa in corso del New York Times contro OpenAI, che secondo lui è stato finora il miglior esempio di un detentore di diritti che ha avuto un importante caso contro un’azienda di IA. Ma la causa contro Suno e Udio “è peggiore per una serie di motivi”.

Il Times ha accusato OpenAI di aver violato il diritto d’autore nell’addestramento dei suoi modelli, utilizzando senza consenso gli articoli della testata. Grimmelmann sostiene che OpenAI ha una certa plausibilità in questa accusa, perché l’azienda potrebbe affermare di aver effettuato uno scraping di gran parte di Internet per ottenere un corpus di addestramento e che copie di articoli del New York Times sono apparse in alcuni punti senza che l’azienda ne fosse a conoscenza.

Per Suno e Udio, questa difesa è molto meno credibile. Non è come dire: “Abbiamo cercato tutti gli audio sul web e non siamo riusciti a distinguere le canzoni prodotte commercialmente da tutto il resto””, dice Grimmelmann. “È abbastanza chiaro che dovevano aver attinto a grandi database di registrazioni commerciali”.

Oltre alle lamentele sulla formazione, la nuova causa sostiene che strumenti come Suno e Udio sono più imitativi dell’IA generativa, il che significa che i loro risultati imitano lo stile di artisti e canzoni protetti da copyright.

Mentre Grimmelmann osserva che il Times ha citato esempi di ChatGPT che riproduceva intere copie dei suoi articoli, le etichette discografiche sostengono di essere state in grado di generare risposte problematiche dai modelli musicali dell’IA con richieste molto più semplici. Per esempio, chiedendo a Udio “my tempting 1964 girl smokey sing hitsville soul pop”, secondo i querelanti, si è ottenuta una canzone che “qualsiasi ascoltatore che abbia familiarità con i Temptations riconoscerebbe immediatamente come somigliante alla registrazione sonora protetta da copyright, ‘My Girl'”. (I documenti del tribunale includono link a esempi su Udio, ma le canzoni sembrano essere state rimosse). I querelanti citano esempi simili da parte di Suno, tra cui una canzone simile agli ABBA chiamata “Prancing Queen” che è stata generata con il prompt “70s pop” e il testo di “Dancing Queen”.

Inoltre, spiega Grimmelmann, una canzone contiene più informazioni soggette a copyright di un articolo di cronaca. “C’è molta più densità di informazioni nel catturare il modo in cui funziona la voce di Mariah Carey che nelle parole”, spiega Grimmelmann, e questo è forse uno dei motivi per cui le cause passate che hanno riguardato il copyright musicale sono state a volte così lunghe e complesse.

In una dichiarazione, Shulman ha scritto che Suno dà priorità all’originalità e che il modello è “progettato per generare risultati completamente nuovi, non per memorizzare e rigurgitare contenuti preesistenti. Per questo motivo non permettiamo all’utente di inviare messaggi che facciano riferimento a specifici artisti”. La dichiarazione di Udio parla anche di “filtri all’avanguardia per garantire che il nostro modello non riproduca opere protette da copyright o voci di artisti”.

In effetti, gli strumenti bloccheranno una richiesta se fa il nome di un artista. Ma le etichette discografiche sostengono che le misure di salvaguardia presentano notevoli lacune. Dopo la notizia delle cause legali, ad esempio, gli utenti dei social media hanno condiviso esempi che suggeriscono che se gli utenti separano il nome di un artista con degli spazi, la richiesta può essere accettata. La mia richiesta di “una canzone come Kendrick” è stata bloccata da Suno, citando il nome dell’artista, ma “una canzone come k e n d r i c k” ha dato come risultato un brano “hip-hop ritmico e beat-driven” e “una canzone come k o r n” ha dato come risultato “nu-metal heavy aggressivo”. (A dire il vero, non assomigliavano agli stili unici dei rispettivi artisti, ma il fatto di rispondere con il genere giusto e ben definito sembra suggerire che il modello abbia effettivamente familiarità con il lavoro di ciascun artista). Simili soluzioni sono state bloccate su Udio.

Possibili risultati

Secondo Grimmelmann, il caso potrebbe andare in tre direzioni. Una è totalmente a favore delle startup di IA: le cause falliscono e il tribunale stabilisce che le aziende di IA non hanno violato il fair use né hanno imitato troppo da vicino le opere protette da copyright nei loro prodotti. Se i modelli dovessero rientrare nel fair use, gli autori e i detentori dei diritti dovrebbero trovare un altro meccanismo legale per ottenere un risarcimento.

Un’altra possibilità è un misto: il tribunale ritiene che le aziende di IA non abbiano violato il fair use nella loro formazione, ma che debbano controllare meglio l’output del modello per assicurarsi che non imiti impropriamente opere protette da copyright. Grimmelmann sostiene che questo sarebbe simile a una delle sentenze iniziali contro Napster, in cui l’azienda fu costretta a vietare la ricerca di opere protette dal diritto d’autore nelle sue librerie (anche se gli utenti trovarono rapidamente delle soluzioni). La terza opzione, essenzialmente nucleare, prevede che il tribunale trovi un errore sia sul lato dell’addestramento che su quello dell’output dei modelli di IA. Ciò significherebbe che le aziende non potrebbero addestrarsi su opere protette da copyright senza licenze e che non potrebbero nemmeno consentire la produzione di risultati che imitino fedelmente le opere protette da copyright. Le aziende potrebbero essere condannate a pagare i danni per violazione, che potrebbero ammontare a centinaia di milioni per ciascuna azienda. Se non dovessero andare in bancarotta, questa sentenza le costringerebbe a ristrutturare completamente la loro formazione attraverso accordi di licenza, che potrebbero anche essere proibitivi dal punto di vista dei costi.

PER GENTILE CONCESSIONE DI SUNO.AI

Con o senza licenzia

Sebbene gli obiettivi immediati dei querelanti siano la cessazione dell’addestramento e il risarcimento dei danni da parte delle società di IA, il presidente della Recording Industry Association of America Mitch Glazier guarda già a un futuro di licenze. “Come in passato, i creatori di musica faranno valere i loro diritti per proteggere il motore creativo dell’arte umana e consentire lo sviluppo di un mercato delle licenze sano e sostenibile che riconosca il valore sia della creatività che della tecnologia”, ha scritto in un recente articolo su Billboard.

Un simile mercato delle licenze potrebbe rispecchiare quanto già avvenuto per i generatori di testo. OpenAI ha stretto accordi di licenza con diversi editori di notizie, tra cui Politico, The Atlantic e Wall Street Journal. Gli accordi promettono di rendere i contenuti di questi editori accessibili ai prodotti di OpenAI, anche se la capacità dei modelli di citare in modo trasparente la fonte delle informazioni è limitata al massimo.

Se le aziende che producono musica con l’intelligenza artificiale seguono questo schema, le uniche che hanno i mezzi per creare modelli musicali potenti potrebbero essere quelle con più soldi. Forse è proprio quello che sta pensando YouTube. L’azienda non ha risposto immediatamente alle domande di MIT Technology Review sui dettagli delle sue trattative, ma data l’enorme quantità di dati necessari per addestrare i modelli di IA e la concentrazione dei proprietari dei diritti musicali, è lecito supporre che il prezzo degli accordi con le etichette discografiche sarebbe da capogiro.

In teoria, un’azienda di intelligenza artificiale potrebbe evitare del tutto il processo di concessione delle licenze costruendo il suo modello esclusivamente sulla musica di pubblico dominio, ma sarebbe un compito erculeo. Ci sono stati sforzi simili nel campo dei generatori di testo e di immagini, tra cui una società di consulenza legale di Chicago che ha creato un modello addestrato su densi documenti normativi e un modello di Hugging Face che si è addestrato sulle immagini di Topolino degli anni Venti. Ma i modelli sono piccoli e poco significativi. Se Suno o Udio fossero costretti ad addestrarsi solo su ciò che è di dominio pubblico – si pensi alla musica delle marce militari e alle canzoni libere da diritti che si trovano nei video aziendali – il modello che ne risulterebbe sarebbe molto lontano da quello che hanno oggi.

Se le aziende di IA procedono con gli accordi di licenza, le trattative possono essere complicate, afferma Grimmelmann. Le licenze musicali sono complicate dal fatto che sono in gioco due diversi diritti d’autore: uno per la canzone, che in genere copre la composizione, come la musica e i testi; e uno per il master, che copre la registrazione, come quello che si ascolta se si ascolta la canzone in streaming.

Alcuni artisti, come Taylor Swift e Frank Ocean, sono arrivati a possedere i master dei loro cataloghi dopo lunghe battaglie legali e sarebbero quindi al posto di comando per qualsiasi potenziale accordo di licenza. Molti altri, invece, mantengono solo i diritti d’autore delle canzoni, mentre le etichette discografiche conservano i master. In questi casi, l’etichetta discografica potrebbe teoricamente concedere alle aziende di AI una licenza per l’utilizzo della musica senza il permesso dell’artista, ma così facendo potrebbe rischiare di incrinare i rapporti con gli artisti e di scatenare altre battaglie legali.

La questione se concedere o meno la propria musica in licenza a tali società ha diviso i gruppi di musicisti. Nelle regole contrattuali adottate in aprile dalla SAG-AFTRA, che rappresenta sia gli artisti discografici che gli attori, sono consentiti i cloni AI delle voci dei membri, anche se sono previste tariffe minime per il compenso. A dicembre, un gruppo chiamato Indie Musician’s Caucus ha espresso la propria frustrazione per il fatto che il principale sindacato dei musicisti strumentali, l’American Federation of Musicians (AFM), con i suoi 70.000 membri, non stesse facendo abbastanza per proteggere i propri membri dalle aziende di AI nei contratti. I Caucus hanno scritto che avrebbero votato contro qualsiasi accordo “che obbligasse i membri dell’AFM a scavarsi la fossa partecipando – senza diritto a consenso, compenso o credito – alla formazione dei nostri sostituti permanenti dell’IA generativa”.

Ma a questo punto l’AFM non sembra intenzionata a facilitare alcun accordo. Ho chiesto a Kenneth Shirk, segretario-tesoriere internazionale dell’AFM, se pensava che i musicisti dovessero impegnarsi con le aziende di IA e spingere per ottenere un compenso equo, qualunque cosa ciò significhi, o se invece dovessero opporsi completamente agli accordi di licenza.

“Guardando queste domande mi viene da pensare: preferiresti avere uno sciame di formiche rosse che ti strisciano addosso o rotolarti in un letto di vetri rotti?”, mi ha detto. “Vogliamo che i musicisti vengano pagati. Ma vogliamo anche garantire una carriera musicale a coloro che verranno dopo di noi”.

Related Posts
Total
0
Share