11

Meta scaricava libri protetti da copyright per addestrare l'IA: le lamentele dei dipendenti in alcune e-mail

Alcune e-mail interne a Meta rese note durante il processo rivelano che l'azienda era a conoscenza dell'utilizzo di libri protetti da copyright per addestrare i suoi modelli di intelligenza artificiale.

NOTIZIA di Raffaele Staccini   —   07/02/2025
Download di libri illegale, immagine generata da un'IA

Nuove prove emergono da una causa intentata nell'estate del 2023 da alcuni autori contro Meta, OpenAI, NVIDIA e Databricks, accusate di utilizzare materiale protetto da copyright per l'addestramento dei loro modelli di intelligenza artificiale. Le email interne a Meta, rivelate di recente, mostrano che l'azienda era consapevole di scaricare illegalmente libri protetti da copyright.

La difesa di Meta si basa sulla distinzione tra scaricare e distribuire materiale protetto da copyright. L'azienda sostiene di non aver distribuito i libri scaricati, limitandosi a utilizzarli per l'addestramento dei suoi modelli di intelligenza artificiale. Tuttavia, l'accusa insiste sul fatto che Meta fosse consapevole dell'illegalità del suo operato.

Un confine "etico"

In particolare, le e-mail si riferiscono al download di almeno 81,7 terabyte di dati da varie biblioteche pirata, tra cui Anna's Archive, Z-Library e LibGen. "Dovrebbe essere oltre la nostra soglia etica", si legge in uno dei documenti. Nonostante ciò, Meta avrebbe proceduto con il download, utilizzando metodi per evitare di essere tracciata.

Una pagine del documento con le e-mail utilizzate nel processo
Una pagine del documento con le e-mail utilizzate nel processo

"L'entità del vasto schema di torrenting illegale di Meta è sbalorditiva," afferma il documento degli autori, insistendo sul fatto che "atti di pirateria di dati di portata enormemente inferiore - solo lo 0,008 percento della quantità di opere protette da copyright che Meta ha piratato - hanno portato i giudici a deferire la condotta all'ufficio dei procuratori degli Stati Uniti per indagini penali."

Un ingegnere di Meta, Nikolay Bashlykov, avrebbe espresso preoccupazione in merito all'utilizzo di materiale piratato: "Scaricare torrent da un laptop aziendale non mi sembra corretto," scriveva in un messaggio dell'aprile 2023, aggiungendo un'emoji sorridente. Nello stesso messaggio, esprimeva "preoccupazione per l'utilizzo degli indirizzi IP di Meta 'per caricare tramite torrent contenuti pirata'".

A settembre 2023, Bashlykov aveva poi abbandonato le emoji, consultando direttamente il team legale e sottolineando in una e-mail che "l'utilizzo di torrent implicherebbe la 'condivisione' dei file, ovvero la condivisione dei contenuti all'esterno, il che potrebbe non essere legalmente corretto".

Vedremo come i giudici valuteranno l'operato della compagnia. Voi che cosa ne pensate? Diteci la vostra nei commenti qua sotto. Intanto un'IA simile a ChatGPT è stata addestrata con 50 dollari e in meno di un'ora.