Nelle prime sperimentazioni, i sistemi di Intelligenza Artificiale erano solo in grado di descrivere i contenuti di un’immagine digitale. Allenando gli algoritmi con grandi quantità di immagini disponibili online, descritte da apposite didascalie, gli scienziati hanno fatto sì che le Intelligenze Artificiali via via cominciassero a distinguere da sole cosa era contenuto in quelle immagini.
Da qui, tra il 2015 e il 2016, si cominciò a sperimentare il processo inverso: dare all’IA la descrizione testuale di un’immagine e fargliela realizzare, traducendo le informazioni in una composizione visiva del tutto nuova, senza servirsi delle immagini già esistenti.
I progressi, da allora, sono stati molto rapidi: dal 2018, cominciarono a diffondersi le Intelligenze Artificiali per la realizzazione di contenuti visuali, fino ad arrivare agli sviluppi odierni più recenti, con IA generative che riescono a raffigurare qualunque cosa. Basta inserire una richiesta con un linguaggio naturale per ottenere in pochi istanti l’immagine corrispondente.
Grazie alla disponibilità di computer sempre più potenti, in grado di elaborare milioni di informazioni in pochi istanti, e di librerie contenenti grandi quantità di immagini con le relative descrizioni, è possibile costruire enormi set di dati dettagliati con cui allenare le IA, generando immagini sempre più precise.
Ma come funziona la creazione di immagini?
L’Intelligenza Artificiale generativa visiva funziona attribuendo valori numerici a ogni pixel, creando relazioni matematiche e sulla base di queste imparando a distinguere le immagini.
Ad esempio, per capire che un certo set di pixel rappresenta una casa, l’IA stabilisce dellemetriche che hanno a che fare con la forma del tetto, della porta o delle finestre. Man mano che si aggiungono nuove variabili e sottovariabili alla casa, ade esmpio il colore, aumentano le relazioni matematiche. E così via. Da qui, attraverso questi milioni di relazioni, l’IA non solo impara a distinguere le immagini, ma anche a crearle.
Gli sviluppatori, poi, possono aggiungere ulteriori algoritmi per migliorare le capacità della loro IA, portandola ad adottare e replicare stili differenti e categorie artistiche definite, anche per rispondere in modo sempre più preciso alle richieste degli utenti.
I migliori esempi in circolazione: Midjourney e Dall-E
Midjourney è tra gli algoritmi di Intelligenza Artificiale text-to-image più recenti, creato nel 2022 da David Holz tramite un progetto autofinanziato. L’utente ha la possibilità di specificare lo stile, il colore, la forma, la prospettiva e altri numerosi dettagli per realizzare la sua immagine. Tutti possono usarlo, in quanto non servono competenze particolari o una formazione in grafica; le istruzioni di cui ha bisogno l’IA sono puramente testuali.
Midjourney usa la Generative Adversarial Network (GAN), una rete neurale composta da due moduli: il primo, chiamato generatore, produce le immagini partendo dal testo, il secondo, discriminatore, valuta se le immagini sono realistiche e precise.
Dall-E è invece l’intelligenza generativa di immagini creata da OpenAI, la stessa società che ha realizzato ChatGPT. Anche in questo caso, basta fornire una descrizione testuale per realizzare l’immagine.
Altri algoritmi noti per la realizzazione di immagini sono poi Imagen e DreamStudio. Ognuno di questi sistemi impiega algoritmi diversi, ma con principi di funzionamento simili.
Il settore è comunque in pieno sviluppo e, a ogni nuovoaggiornamento, si notano sviluppi importanti nei dettagli delle immagini, sempre più aderenti alle richieste e al gusto estetico degli
Gli interrogativi
Da qualche mese, coloro che lavorano nel mondo della grafica e delle illustrazioni hanno iniziato a mostrare una certa preoccupazione verso le IA, che realizzano immagini sempre più soddisfacenti, realistiche e accurate. Il rischio è che, per alcuni tipi di immagini, il lavoro di questi professionisti possa essere sostituito da algoritmi a basso costo.
A questo si aggiungono gli interrogativi sulle regole che disciplinanoil diritto d’autore delle immagini generate daIA eproblemi legati ai bias,tematiche da affrontare anche nella generazione di testi.L’Intelligenza Artificiale, infatti, sembra avere dei bias culturali dettati dalle fonti di informazioni a cui attinge: parliamo, tra le altre cose, di discriminazioni di genere o di etnia. Se nel set di dati che le IA hanno a disposizione sono rappresentati, per esempio, soprattutto uomini bianchi nelle posizioni di potere, quando si chiede all’IA di raffigurare il manager di una società, l’immagine difficilmente rappresenterà una donna nera.