Ufficio

DALL-E: l’algoritmo che genera immagini da descrizioni testuali

Sviluppato da OpenAI e presentato il 5 gennaio 2021, DALL-E sta segnando un punto di svolta straordinario nel percorso evolutivo dell’Intelligenza Artificiale. Vediamo perché.

 

Che cos’è e come funziona?

Nel caso in cui questo nome vi riporti alla mente qualcosa, non state sbagliando: DALL-E è un omaggio all’artista Salvador Dalì e al robottino WALL-E della Pixar.

In grado di produrre immagini da descrizioni testuali, questo rivoluzionario sistema è una variante del modello di elaborazione del linguaggio naturale GPT-3. Quest’ultimo, crea testi spesso indistinguibili da quelli creati dalla mente umana, mentre DALL-E, con i suoi 12 miliardi di parametri, realizza interpretazioni grafiche.

DALL-E, composto da coppie testo-immagine, consente di avere una rappresentazione grafica dei singoli termini descritti. La successiva combinazione di concetti e la modifica di immagini esistenti è tutto merito di DALL-E, al quale è possibile chiedere fantasticherie come “un razzo con un tutù” e ottenere le immagini che seguono:

 

 

In alcuni casi, se vengono fatte richieste molto specifiche, DALL-E tende a dimenticare o scambiare qualche elemento.

Per esempio: “Un cane grande con una felpa blu, occhiali da sole verdi e cuffie nere”.

Ecco i risultati:

 

DALL-E non è stato creato con un obiettivo specifico dai ricercatori di OpenAI, ma, sicuramente, potrebbe essere un sistema adatto ad ambiti creativi, come l’interior design e la moda, in cui c’è bisogno di fantasia visiva e nuove ispirazioni.

 

Aprile 2022: arriva DALL-E 2

Cinque mesi fa, è stata introdotta una nuova versione di questo sistema. Se già DALL-E era in grado di fornire immagini accurate, ora DALL-E 2 ha la capacità di realizzare creazioni ancora più realistiche e con una risoluzione 4 volte maggiore da una descrizione in linguaggio naturale.

La cosa incredibile di DALL-E 2 è che può espandere le immagini oltre ciò che è nella tela originale, tenendo conto di ombre, riflessi e trame. Esso utilizza un processo chiamato “diffusione”, che inizia con uno schema di punti casuali e modifica gradualmente quel modello verso un’immagine quando riconosce aspetti specifici di quell’immagine.

L’obiettivo di OpenAI è quello di consentire alle persone di esprimersi in completa libertà: DALL-E 2 aiuta a capire in che modo i sistemi di Intelligenza Artificiale avanzati vedono e interpretano il nostro mondo, il che è fondamentale per la loro missione di creare un’IA a beneficio di tutti noi.

 

Entrambi questi due sistemi sono il risultato della continua evoluzione dell’Intelligenza Artificiale. Quali altre innovazioni vedremo nascere e svilupparsi con il passare degli anni?

Tags: