OpenAI ha introdotto una nuova funzionalità di generazione di immagini all’interno di ChatGPT e Sora, utilizzando la tecnologia di GPT-4o. La novità riguarda la capacità di creare immagini direttamente nella piattaforma, insieme a significativi miglioramenti tecnici rispetto ai precedenti modelli.
La novità principale di questo sistema è l’adozione del modello multimodale di GPT-4o, che permette la generazione non solo di testo, ma anche di immagini, audio e video. La nuova funzione utilizza un approccio autoregressivo, generando le immagini sequenzialmente, in modo analogo alla produzione di testo. Si distingue inoltre per capacità avanzate di “binding”, ovvero la precisione nel mantenere corrette relazioni tra attributi e oggetti. Secondo i ricercatori di OpenAI, è in grado di gestire correttamente le relazioni tra 15-20 oggetti, superando i limiti dei precedenti modelli che spesso mostravano difficoltà con rappresentazioni complesse. Un altro miglioramento significativo riguarda il rendering del testo, che permette la creazione di immagini con scritte leggibili e prive di errori.
La funzionalità sarà disponibile su tutti i livelli di abbonamento di ChatGPT, inclusi i piani gratuiti, Plus e Pro. OpenAI ha inoltre precisato l’implementazione di misure di sicurezza per prevenire usi inappropriati, incluso il blocco della generazione di immagini e contenuti potenzialmente dannosi.
Leggi l’articolo completo “OpenAI rolls out image generation powered by GPT-4o to ChatGPT” su The Verge
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025)

