OpenAI ha infine ammesso che sarebbe impossibile creare strumenti basati sull'intelligenza artificiale come ChatGPT senza accedere a materiale protetto da copyright. La pressione sulle compagnie che stanno realizzando strumenti simili va facendosi sempre più forte, con molti che stanno iniziando a chiedersi da dove provengano i dati usati per addestrare le IA.
I vari strumenti IA per i testi, come ChatGPT, e per le immagini, come Midjourney, hanno bisogno di essere addestrati con grandissime quantità di dati, presi soprattutto dalla rete, molti dei quali protetti da copyright. Ossia, in teoria dovrebbero essere tutelati dall'utilizzo non autorizzato di terzi.
BIsogna garantire la libertà di rubare alle AI?
Il mese scorso, il New York Times ha denunciato OpenAI e Microsoft, quest'ultima il maggior investitore in OpenAI, per uso scorretto dei suoi testi, usati senza consenso per addestrare le IA.
In una dichiarazione inviata alla alla Camera dei Lord, OpenAI ha ammesso che non potrebbe addestrare i suoi LLM (Large Language Model o modelli linguistici di grandi dimensioni), come GPT-4, senza l'utilizzo di materiale protetto da copyright: "Siccome oggi il copyright copre praticamente ogni tipo di espressione umana, tra cui i post dei blog, le fotografie, i post sui forum, frammenti di codice software e documenti governativi, sarebbe impossibile addestrare i modelli AI senza utilizzare materiali coperti da copyright".
Il messaggio prosegue affermando che limitare il materiale di addestramento a quello non coperto da copyright produrrebbe dei sistemi di intelligenza artificiale inadeguati, non in grado di raggiungere gli standard richiesti attualmente.
Insomma, pare che le numerose cause in corso contro le intelligenze artificiali generative dovranno stabilire se sia lecito per i colossi multimiliardari che le gestiscono rubare le opere altrui al fine di addestrarle.