Addestramento di modelli IA e diritto d’autore (in particolare, text and data mining). Tribunale di Monaco di Baviera.
Il Tribunale di Monaco di Baviera, sezione specializzata in diritto d’autore, con sentenza dell’11/11/2025, ha accolto le domande di GEMA - società di gestione collettiva dei diritti d’autore per compositori, parolieri ed editori musicali - contro due società del gruppo OpenAI, riconoscendo violazioni del diritto d’autore.
GEMA sosteneva che i testi di note composizioni musicali di autori tedeschi fossero stati memorizzati nei modelli linguistici delle convenute e riprodotti, su richiesta degli utenti, negli output dei relativi chatbot. Le società convenute opponevano che i modelli non memorizzano dati specifici, ma rielaborano informazioni statistiche e che la responsabilità degli output è degli utenti in relazione ai prompt; in subordine, chiedevano il riconoscimento delle eccezioni di legge, in particolare il text and data mining (TDM) della Direttiva Copyright.
Il Tribunale ha stabilito che, mancando un consenso anche implicito degli autori (l’addestramento dei modelli non può considerarsi uso comune o atteso dagli aventi diritto), la memorizzazione dei testi musicali nei modelli e la relativa riproduzione negli output costituiscono violazioni dei diritti esclusivi di utilizzazione economica delle opere.
In particolare, il Tribunale ha accertato la memorizzazione, ossia l’incorporazione dei testi musicali nei parametri del modello in forma riproducibile, escludendo una coincidenza casuale, considerata anche la complessità dei testi. Si è esclusa l’applicabilità dell’eccezione TDM, dato che essa copre solo riproduzioni tecniche e temporanee funzionali all’analisi dei dati, e non la riproduzione stabile delle opere. Se l’opera è memorizzata in modo da poter essere riprodotta e comunicata al pubblico, si va oltre il TDM e si incidono gli interessi economici degli aventi diritto. Del pari, si è esclusa un’inclusione occasionale, ossia la riproduzione di un’opera ammessa se di carattere insignificante e accessorio rispetto all’opera effettivamente oggetto della riproduzione (il set di dati di addestramento, considerato lo scopo, non si classifica come opera per il diritto d’autore).