L’IA alla prova dello streaming: quali tutele per i contenuti creativi originali

18 aprile 2023

L’utilizzo di contenuti protetti per “addestrare” sistemi di AI come chatGPT è sempre più diffuso e tali contenuti potranno inquinare le piattaforme streaming con produzioni generate dall’intelligenza artificiale a danno della creatività di autori ed artisti.

A rilanciare l’allarme è stato pochi giorni fa il Financial Times, che ha dato la notizia di un’iniziativa assunta dalla maggiore impresa del settore discografico, la Universal Music (UMG), etichetta di Taylor Swift, U2, Katy Perry e in Italia di artisti come Vasco Rossi, Tiziano Ferro, Elodie e Blanco, con l’invio di una serie di comunicazioni alle principali piattaforme streaming per chiedere “di interrompere l’accesso al loro catalogo musicale per gli sviluppatori che lo utilizzano per addestrare la tecnologia AI”. “Non esiteremo a prendere provvedimenti per proteggere i nostri diritti e quelli dei nostri artisti”, ha scritto UMG alle piattaforme online a marzo, nelle e-mail viste dal FT. “Questa prossima generazione di tecnologia pone problemi significativi”, ha affermato una persona vicina alla situazione. “Gran parte [dell’IA generativa] è addestrata grazie all’ingestione di dati provenienti dalla più diffusa musica pop a livello globale” aggiungeva UMG.

L’incertezza giuridica sul text and data mining

Il tema del machine learning è connesso all’estrazione di contenuti protetti che è la base sulla quale è costruita ogni applicazione di AI. In questo contesto si può chiaramente associare questo tipo di attività al cosiddetto text and data mining che è stato oggetto della recente Direttiva copyright dell’UE, la 790/2019.

La direttiva ha stabilito che, oltre a essere rilevanti nel contesto della ricerca scientifica, le tecniche di estrazione di testo e di dati sono ampiamente utilizzate da soggetti sia pubblici che privati per analizzare grandi quantità di dati in diversi settori della vita e per vari scopi, tra cui i servizi della pubblica amministrazione, decisioni commerciali complesse e lo sviluppo di nuove applicazioni o tecnologie. I titolari dei diritti dovrebbero mantenere la possibilità di concedere licenze per gli utilizzi delle proprie opere o altri materiali esulanti dall’ambito di applicazione dell’eccezione obbligatoria prevista dalla presente direttiva relativa all’estrazione di testo e di dati a fini di ricerca scientifica e delle eccezioni e limitazioni vigenti di cui alla direttiva 2001/29/CE. Allo stesso tempo, occorre tener conto del fatto che gli utilizzatori, nell’estrazione di testo e di dati, potrebbero trovarsi in una situazione di incertezza giuridica quanto alla possibilità di effettuare o meno, su opere o altri materiali cui hanno avuto legalmente accesso, riproduzioni ed estrazioni finalizzate all’estrazione di testo e di dati, in particolare quando le riproduzioni o estrazioni effettuate ai fini del procedimento tecnico potrebbero non soddisfare tutte le condizioni previste dall’attuale eccezione per gli atti di riproduzione temporanea di cui all’articolo 5, paragrafo 1, della direttiva 2001/29/CE.

Per accrescere in tali casi la certezza del diritto, e per incoraggiare l’innovazione anche nel settore privato, è opportuno che la presente direttiva disponga, a determinate condizioni, un’eccezione o una limitazione per le riproduzioni e le estrazioni di opere o altri materiali, a scopo di estrazione di testo e di dati, e consenta di conservare le copie realizzate per il tempo necessario ai fini dell’estrazione di testo e di dati. Tale eccezione o limitazione dovrebbe applicarsi solo in caso di accesso legale all’opera o altri materiali da parte del beneficiario, anche quando l’opera o altri materiali sono stati messi a disposizione del pubblico online, e nella misura in cui i titolari dei diritti non abbiano riservato in maniera appropriata i diritti di effettuare riproduzioni ed estrazioni ai fini dell’estrazione di testo e di dati.

Gli appigli della Direttiva Ue

Nel caso dei contenuti resi disponibili al pubblico online, dovrebbe essere ritenuto appropriato riservare tali diritti solo attraverso l’uso di strumenti che consentano una lettura automatizzata, inclusi i metadati e i termini e le condizioni di un sito web o di un servizio. La riserva di diritti ai fini dell’estrazione di testo e di dati non dovrebbe pregiudicare altri usi. In altri casi può essere appropriato riservare i diritti con altri mezzi, quali accordi contrattuali o una dichiarazione unilaterale. I titolari dei diritti dovrebbero poter applicare misure per garantire il rispetto delle loro riserve in proposito. Tale eccezione o limitazione dovrebbe lasciare inalterata l’eccezione obbligatoria relativa all’estrazione di testo e di dati a fini di ricerca scientifica di cui alla presente direttiva, nonché l’attuale eccezione per gli atti di riproduzione temporanea di cui all’articolo 5, paragrafo 1, della direttiva 2001/29/CE.

Come si vede molto bene da tale previsione, pur non citando il tema dell’intelligenza artificiale e tanto meno quella generativa, la normativa europea offre un evidente appiglio per tutelare i contenuti da un’attività estrattiva senza limite.

La normativa italiana

Nella normativa italiana, tale previsione ha trovato la propria definizione nell’art. 70 ter l.d.a. che definisce il text e data mining, l’estrazione di testo e dati, come “qualsiasi tecnica automatizzata volta ad analizzare grandi quantità di testi, suoni, immagini, dati o metadati in formato digitale con lo scopo di generare informazioni, inclusi modelli, tendenze e correlazioni”.

All’art. 70 quater si consente l’estrazione di testo e dati in generale, da parte di chiunque, anche per mero fine di lucro.

Pertanto, le imprese e gli sviluppatori che intendano utilizzare opere protette dal copyright per addestrare un sistema di intelligenza artificiale generativa dovranno rispettare tre criteri:

  • ottenere un accesso legittimo ai dati;
  • verificare che i titolari dei diritti non si siano riservati il diritto di effettuare le riproduzioni a fini del TDM;
  • conservare le copie effettuate solo per il tempo necessario ai fini del TDM.

Gli utilizzi del machine learning (ML) connessi con l’addestramento e il text e data mining

Vediamo nel dettaglio quali sono gli utilizzi più diffusi in questo momento di sistemi di machine learning (ML) connessi con l’addestramento e il text e data mining. Per quanto attiene alle composizioni musicali l’IA generativa può costruire una composizione musicale, con la composizione di output che può essere ulteriormente modificata da un artista o trasformata in una registrazione rendendo la composizione attraverso diversi tipi di strumenti e sintetizzatori MIDI (Musical Instrument Digital Interface). Laddove queste composizioni AI utilizzano ML, il modello verrebbe addestrato su composizioni preesistenti sotto forma di notazione o MIDI. I modelli di composizione generativa potrebbero essere co-addestrati sui dati di composizione, insieme ai tag di testo, per consentire ai termini basati sul testo di guidare il processo generativo.

Sul fronte delle registrazioni musicali, esse vengono create direttamente come output dell’IA. Un metodo è attraverso la stretta integrazione tra le composizioni AI e gli strumenti suonati dal computer (vedi sopra). Ma laddove i suoni sono sintetizzati direttamente come output AI, ciò richiede l’addestramento di modelli ML su multipli di registrazioni esistenti.

Le registrazioni generative possono spesso catturare il timbro e la sensazione espressiva in un modo che non è accessibile nelle composizioni generative. Questo perché un modello addestrato su registrazioni esistenti è in grado di “assorbire” le qualità sonore del materiale di formazione. In alcuni casi, i modelli possono anche essere co-addestrati su registrazioni e tag di testo, per consentire ai termini basati su testo di guidare il processo generativo.

Ulteriori utilizzi dell’IA comprendono il sampling, la trascrizione, i generatori di beat o di strumenti, il remix, ecc.

Altri impieghi dell’IA

Da non sottovalutare inoltre gli strumenti software per segmentare un’introduzione di registrazione esistente con piani separati, ad esempio piano vocale e un piano per gli strumenti strumentali o anche individuali. che in cambio può essere utilizzato per il remix o per creare input per l’intelligenza artificiale, ad esempio per consentire l’addestramento di un modello vocale sulla voce di un particolare cantante. I modelli di formazione creati utilizzando la voce dell’artista, estratti dal processo di cui sopra, possono essere utilizzati per creare nuove tracce dell’artista e nuovi contenuti dell’artista e stanno guadagnando sempre più popolarità.

Infine, altri impieghi che coinvolgono l’IA sono il beat Matching ovvero un processo utilizzato dai DJ per fondere le tracce. Sono disponibili strumenti di corrispondenza del ritmo intelligenti, sebbene questa non sia realmente una forma di intelligenza artificiale creativa.

Grafica/Video. L’avvento di strumenti come Dall-E, Stable Diffusion, Midjourney e altri, sta aprendo la strada alla creazione di opere d’arte come copertine di album o grafica NFT. Ci sono molti problemi di copyright implicati e diversi fornitori di immagini stock non distribuiscono immagini generate dall’intelligenza artificiale a causa di domande e rischi aperti. Stanno emergendo strumenti di intelligenza artificiale per generare video ad alta frequenza di fotogrammi.

I testi sarebbero parte integrante del processo di composizione. Algoritmi come GPT3 sono altamente capaci di generare testo coerente, inclusa la poesia.

Deepfake. In un contesto musicale ciò si riferisce alla creazione di suoni, generalmente vocali, basati su modelli deepfake della voce o dello stile di un artista specifico. Questa tecnologia può anche essere utilizzata per simulare la somiglianza di un artista.

Conclusioni

Abbiamo pertanto di fronte molte innovazioni che sconvolgeranno il settore musicale e che devono trovare da un lato, come abbiamo visto, una regolamentazione legislativa a tutela degli aventi diritto e dall’altra un presidio di content protection per evitare che opere derivative generate dalla IA senza autorizzazione inquinino il processo creativo originale.

Come ha chiosato un responsabile di Universal Music nell’intervista al FT: “Abbiamo la responsabilità morale e commerciale nei confronti dei nostri artisti di lavorare per impedire l’uso non autorizzato della loro musica e impedire alle piattaforme di ingerire contenuti che violano i diritti degli artisti e di altri creatori. Siamo certi che i nostri partner delle piattaforma vorranno impedire che i loro servizi vengano utilizzati in modi che danneggino gli artisti”.