AI, vittoria storica degli autori nel caso OpenAI vs Gema
La prima sentenza in materia di diritti d’autore e AI generativa nell’Unione Europea arriva dalla Germania dove il Tribunale di Monaco I (LG München I) ha condannato OpenAI e la sua intelligenza artificiale ChatGPT nella causa promossa dalla società di gestione collettiva tedesca GEMA.
Secondo quanto comunicato dal Tribunale, con la 42ª Camera civile, l’utilizzo di testi di canzoni da parte della piattaforma viola il diritto d’autore. Come è noto, la causa è stata intentata dalla società di gestione collettiva GEMA qualche mese fa. In concreto, si trattava di nove brani – tra cui titoli famosi come “Atemlos” di Helene Fischer e Kristina Bach, “Männer” di Herbert Grönemeyer, “Über den Wolken” di Reinhard Mey, nonché “In der Weihnachtsbäckerei” e “Wie schön, dass du geboren bist” di Rolf Zuckowski.
I cardini della decisione: memorizzazione e violazione del copyright
Questi sarebbero i cardini principali della sentenza:
- Il tribunale ha stabilito che la generazione di testi di nove canzoni negli output di OpenAI dimostra che il modello ha “memorizzato” tali opere. Ha ritenuto che questa attività costituisca una violazione del diritto d’autore sia per le riproduzioni avvenute all’interno del modello stesso, sia per la successiva messa a disposizione delle opere negli output. Quest’ultima (la capacità del modello di generare i testi) è stata considerata prova sufficiente che copie complete delle opere devono essere state riprodotte nel modello stesso e che tale copia costituisce una violazione del diritto d’autore.
- Il tribunale ha affermato: «Ai fini della riproduzione ai sensi del diritto d’autore, può rimanere aperta la questione di come funzioni in dettaglio la memorizzazione. È irrilevante se si parli di archiviazione o copia dei dati di addestramento o, come sostengono i convenuti, se il modello rifletta nei suoi parametri ciò che ha appreso sull’intero set di dati di addestramento, ossia relazioni e schemi di tutte le parole o token che rappresentano la diversità del linguaggio umano e dei suoi contesti.
La responsabilità di OpenAI e il rigetto delle eccezioni
Il fattore decisivo è che i testi delle canzoni utilizzati come dati di addestramento siano contenuti in modo riproducibile nel modello e quindi incorporati in esso.»
- OpenAI è stata ritenuta responsabile delle violazioni e il giudice ha espresso che avrebbe dovuto ottenere una licenza per l’uso. Il tribunale ha affermato: «I convenuti devono essere classificati come autori materiali perché esercitano il controllo sulla riproduzione attraverso gli output. I convenuti gestiscono i modelli per i quali i testi delle canzoni in questione sono stati selezionati come dati di addestramento e con i quali sono stati addestrati. Sono responsabili dell’architettura dei modelli e della memorizzazione dei dati di addestramento.»
- Il tribunale ha respinto l’argomento di OpenAI secondo cui la loro attività non costituirebbe violazione poiché i testi delle canzoni sono «già disponibili gratuitamente su Internet tramite servizi on-demand». Il tribunale ha chiarito che «né il diritto tedesco né quello dell’UE riconoscono un principio secondo il quale le opere possano essere sfruttate senza consenso perché un terzo ha già intrapreso tale condotta».
- Il tribunale ha ritenuto che un’ingiunzione contro l’uso dei nove testi non fosse sproporzionata, affermando espressamente che i convenuti possono evitare l’ingiunzione ottenendo una licenza.
- Sebbene il tribunale abbia ritenuto che le eccezioni UE per il Text and Data Mining (TDM) siano pertinenti nello sviluppo dell’IA generativa, esse non si applicano in questo caso perché le riproduzioni delle opere nel modello e negli output vanno oltre l’ambito delle eccezioni. Il tribunale ha chiarito che le eccezioni TDM si limitano all’estrazione di informazioni ai fini del text and data mining, ma non alla riproduzione integrale delle opere da parte del modello.
Il precedente del caso LAION e le differenze con GEMA
Sul tema si era espresso il tribunale di Amburgo, che aveva applicato l’esenzione nella decisione del 2024 nel caso LAION vs Kneschke riguardante un’organizzazione senza scopo di lucro che aveva copiato una foto per creare un set di dati atto ad addestrare un modello di intelligenza artificiale. In quel caso la Corte di Amburgo aveva chiarito come si configurassero tutti gli elementi richiesti dalla norma:
- la natura non commerciale del soggetto (ente non-profit);
- la finalità scientifica del TDM (il dataset è stato pubblicato gratuitamente e a disposizione della comunità accademico-scientifica);
- l’assenza di finalità diretta di sfruttamento commerciale dell’opera tutelata.
L’analisi tecnica: addestramento, memorizzazione e output
Entrando invece nei dettagli del caso GEMA va ricordato che i testi delle canzoni erano stati utilizzati per l’addestramento di ChatGPT e, in risposta a semplici prompt, essi erano stati riprodotti in modo identico o almeno sostanzialmente simile (i cosiddetti output). I giudici hanno considerato questo come la prova che le lyrics erano state memorizzati nei sistemi di OpenAI. Il tribunale ha così condannato OpenAI, a non memorizzare i testi né riprodurli nei suoi modelli, al risarcimento dei danni (che sarà oggetto di un’ulteriore decisione di un tribunale) e alla divulgazione di informazioni sull’utilizzo e sui ricavi ottenuti (trasparenza). È stata invece respinta la domanda relativa alla violazione del diritto generale alla personalità.
Text and Data Mining: quando l’eccezione non si applica
In concreto secondo la corte, sia la memorizzazione negli LLM sia la riproduzione dei testi delle canzoni negli output del chatbot costituiscono violazioni dei diritti d’autore. Questa riproduzione nei modelli non è coperta né dalle disposizioni sul Text and Data Mining (TDM) di cui al § 44b della Legge sul diritto d’autore tedesca (UrhG). Il Text and Data Mining consente la ricerca automatizzata su Internet e la raccolta di dati, anche da opere protette dal diritto d’autore, a fini di analisi. Se ciò includa l’addestramento delle IA è un tema controverso anche in sede comunitaria perché la norma sul TDM è antecedente all’esplosione dell’AI generativa.
Il nodo dello sfruttamento commerciale e della responsabilità
E qui il tribunale tedesco è molto chiaro: non si tratta di Text and Data Mining quando, come nel caso in esame, non vengono solo estratte informazioni dai dati di addestramento, ma le opere vengono riprodotte. Le riproduzioni effettuate nel modello incidono sul diritto di sfruttamento dei titolari dei diritti. L’intervento di OpenAI non è giustificato da alcun consenso dei titolari dei diritti, perché l’addestramento dei modelli non è considerato un uso abituale e prevedibile con cui il titolare dei diritti debba ragionevolmente fare i conti. Anche la riproduzione dei testi delle canzoni negli output costituisce, secondo la decisione della corte di Monaco, una riproduzione e la messa a disposizione del pubblico non autorizzata. Negli output gli elementi originali dei testi erano sempre riconoscibili, la responsabilità, non è degli utenti, ma di OpenAI che invece aveva sostenuto una responsabilità di questi ultimi.
Le reazioni: dalla presidente del tribunale alla difesa di OpenAI
La presidente del collegio, Elke Schwager, ha riassunto la decisione in maniera molto chiara: “siamo di fronte ad un imputato altamente intelligente, capace di sviluppare tecnologie all’avanguardia, eppure sembra sorprendente che non comprenda: se si vuole costruire qualcosa e servono dei componenti – allora li si acquista e non si utilizza la proprietà altrui.” OpenAI, dal canto suo, ha dichiarato di contestare la sentenza e di valutare ulteriori passi. La decisione riguarda un insieme limitato di testi di canzoni e non ha impatti sugli utenti. L’azienda ha affermato che il rispetto dei diritti degli autori e dei titolari dei diritti è il proprio scopo primario.
Scenari futuri e impatti sull’industria creativa
La sentenza non è ancora definitiva ed è abbastanza probabile che la controversia sia appellata e che altre corti superiori se ne occupino. Se però il successo di GEMA dovesse diventare definitivo, questo cambierebbe gli equilibri di potere tra l’industria creativa e le aziende tecnologiche a favore degli autori e degli altri titolari dei diritti, perché prima che un testo o contenuto creativi possa essere utilizzato per l’IA generativa, i titolari dei diritti dovrebbero dare il loro consenso e avrebbero la possibilità di ricevere una remunerazione sulla base di una licenza.
Stati Uniti: il fair use e il caso Bartz contro Anthropic
Le diverse decisioni in USA e Regno Unito. La decisione tedesca segue un profilo diverso da due decisioni prese negli Stati Uniti e più di recente nel Regno Unito. Nel caso Bartz/Anthropic Il giudice William Alsup aveva stabilito una distinzione fondamentale: l’addestramento di Large Language Model costituisce un uso “spettacolarmente trasformativo” protetto dalla dottrina del fair use quando i contenuti vengono acquisiti legalmente, ma diventa illecito quando si basa su materiali attinti da piattaforme illegali come BitTorrent. La sentenza aveva stabilito che gli autori non possono controllarlo poiché l’uso trasformativo proprio degli LLM non rientra nei diritti riservati dal copyright. Tuttavia, il caso, come noto, si è poi concluso con un accordo transattivo.
Regno Unito: Getty Images vs Stability AI, una sentenza intermedia
Nel Regno Unito, l’Alta Corte di Giustizia ha emesso una sentenza contrastante nella causa Getty Images contro Stability AI relativa alla proprietà intellettuale, intentata nel 2023, favorendo in gran parte Stability AI ma lasciando senza risposta alcune questioni fondamentali sull’uso da parte dell’IA di materiale protetto da copyright.
Da un lato il modello di intelligenza artificiale Stable Diffusion di Stability avrebbe violato il marchio registrato di Getty, in alcuni casi riproducendone il watermark ma dall’altro la giudice Smitha ha respinto l’accusa di “violazione secondaria” in quanto il modello IA non memorizza né riproduce le immagini, non soddisfacendo i requisiti per una violazione ai sensi del Copyright, Designs and Patents Act (CDPA) del 1988 del Regno Unito. Il giudice ha scritto nella decisione: “Sebbene un ‘articolo’ possa costituire un oggetto immateriale ai fini del CDPA, un modello di intelligenza artificiale come Stable Diffusion, che non memorizza né riproduce alcuna opera protetta da copyright e non lo ha mai fatto, non costituisce una ‘copia illecita‘ e pertanto non vi è alcuna violazione ai sensi degli articoli 22 e 23 del CDPA.
Le questioni irrisolte nel sistema britannico
La richiesta di Getty per violazione primaria (cioè, violazione del diritto d’autore derivante dall’addestramento del modello) era stata volontariamente ritirata da Getty in una fase precedente del procedimento a causa delle difficoltà nel dimostrare che l’attività si fosse svolta nel Regno Unito. Pertanto, la questione se l’addestramento di un modello di IA su contenuti protetti dal diritto d’autore costituisca una violazione del diritto d’autore rimane ancora irrisolta dai tribunali britannici mentre come abbiamo visto è stata per ora risolta a favore dei titolari dei diritti in Europa con la decisione GEMA.
Gli accordi di licenza come soluzione di mercato
Le licenze come soluzione di mercato. Tutto questo ci riporta ad un passaggio chiave per lo sviluppo del mercato dell’AI nel settore creativo. L’unica soluzione praticabile resta quella degli accordi di licenza. Sebbene l’IA sia un mercato nascente e gli sforzi per tutelare i diritti e la remunerazione in questo ambito siano ancora in corso, quando verranno conclusi accordi e generati ricavi, le case discografiche compenseranno gli artisti secondo i loro contratti e, ove richiesto, sarà ottenuto il consenso degli artisti. La linea che sembra tracciata nei primi accordi quali quello tra Universal Music e Udio è quella di individuare delle soluzioni negoziali con le piattaforme per offrire nuove opportunità, tramite l’AI, ad artisti e fan, garantendo anche i ritorni economici per tutta la filiera.
Torna su Condividi articolo


