OpenAI ha annunciato il ritiro della voce di ChatGPT conosciuta come Sky, dopo che numerosi articoli e persino il Saturday Night Live hanno evidenziato la somiglianza impressionante con la voce di Scarlett Johansson. La decisione arriva nonostante OpenAI affermi che la somiglianza non fosse intenzionale.
La voce di Sky e Scarlett Johansson
La voce Sky è stata introdotta come parte delle nuove funzionalità vocali di ChatGPT, destinate a rendere l'interazione con l'IA più naturale e coinvolgente. Tuttavia, la somiglianza con la voce dell'attrice Scarlett Johansson ha sollevato molte polemiche. "Crediamo che le voci AI non dovrebbero deliberatamente imitare la voce distintiva di una celebrità-la voce di Sky non è un'imitazione di Scarlett Johansson ma appartiene a un'attrice professionista che usa la sua voce naturale," ha scritto OpenAI in una dichiarazione.
La CTO di OpenAI, Mira Murati, ha negato che l'imitazione fosse intenzionale in un'intervista con The Verge la scorsa settimana. Anche se la voce di Johansson non è stata direttamente presa come riferimento, il CEO di OpenAI, Sam Altman, sembrava già consapevole della somiglianza, pubblicando il messaggio Her su X (ex Twitter) dopo la scoperta. Altman ha precedentemente dichiarato che "Her", il film di Spike Jonze in cui Scarlett Johansson presta la voce a un assistente virtuale, è il suo film preferito.
Problemi legali in arrivo?
OpenAI non ha menzionato se abbia ricevuto contatti riguardanti potenziali problemi legali o sfide relative alla somiglianza della voce del suo assistente con quella di Johansson o del suo ruolo in "Her". Tuttavia, la decisione di ritirare la voce di Sky potrebbe essere stata presa per prevenire qualsiasi controversia legale.
La modalità vocale di ChatGPT e il modello vocale Sky sono stati introdotti lo scorso anno. Tuttavia, la funzione è diventata molto più prominente la scorsa settimana, quando OpenAI ha dimostrato i progressi raggiunti come parte del nuovo modello GPT-4o. Il nuovo modello rende l'assistente vocale più espressivo e gli permette di leggere le espressioni facciali attraverso la fotocamera del telefono e di tradurre il linguaggio parlato in tempo reale.
Le cinque voci attualmente disponibili per ChatGPT sono state selezionate tra oltre 400 candidature da parte di doppiatori e attori cinematografici, secondo OpenAI. L'azienda ha rifiutato di condividere i nomi degli attori, citando la necessità di "proteggere la loro privacy".