OpenAI ha annunciato un ritardo nella distribuzione del nuovo generatore di immagini integrato in ChatGPT per gli utenti del piano gratuito. A confermarlo è stato lo stesso Sam Altman, CEO dell'azienda, che in un post ha dichiarato che lo strumento si è rivelato "più popolare del previsto", costringendo il team a rimandare l'implementazione per chi non ha un abbonamento attivo.
Il boom di immagini “alla Ghibli” intasa la rete
Lanciato martedì per gli utenti dei piani Plus, Pro e Team, il nuovo generatore di immagini sfrutta GPT-4o, il modello multimodale "ragionante" di OpenAI che permette di creare contenuti visuali direttamente all'interno di ChatGPT. In poco tempo, i social sono stati invasi da illustrazioni create in stile Studio Ghibli, con utenti entusiasti che mostrano personaggi, paesaggi e animali generati con un'estetica onirica e poetica.
Lo stesso Altman ha partecipato alla tendenza pubblicando immagini ispirate al celebre studio d'animazione giapponese, testimoniando quanto il nuovo strumento sia capace non solo di generare contenuti visivi coerenti, ma anche di evocare uno stile artistico preciso con grande accuratezza.
Un modello autoregressivo per migliorare qualità e precisione
GPT-4o utilizza un approccio autoregressivo, costruendo le immagini pixel dopo pixel da sinistra a destra e dall'alto verso il basso. A differenza dei modelli di diffusione come DALL·E, questo metodo consente una migliore gestione dei dettagli e del testo, due punti critici per la generazione di immagini AI. Uno dei vantaggi principali è la capacità di mantenere coerenza tra attributi e oggetti, migliorando nettamente la resa in composizioni complesse, con fino a 20 elementi diversi che possono essere legati correttamente.
Tra le altre migliorie, il team OpenAI ha evidenziato una resa più stabile del testo all'interno delle immagini, che ora viene visualizzato in modo leggibile e coerente, riducendo gli errori comuni dei precedenti generatori AI.