Intelligenza artificiale per la creazione di immagini a partire da una testo… e i creativi umani disoccupati?

L’eccellente qualità dei risultati ottenuti con taluni strumenti, spinge a fantasticare di scenari lavorativi in cui non è più indispensabile avere nel proprio entourage un esperto di grafica o un creativo.

In questo articolo parliamo di Intelligenza Artificiale, AI o IA, qual dir si voglia. Nella fattispecie parliamo di una sua particolare applicazione; quella della generazione di immagini a partire da un testo. Un poco come se commissionaste ad un artista un lavoro fornendo una descrizione di ciò che vi serve.

Vi diciamo subito che il livello a cui è arrivata la tecnica consente di avere risultati eccellenti ed inimmaginabili anche solo qualche anno fa. Abbiamo testato alcuni strumenti text to image disponibili gratuitamente online in questo post, dove ne mostriamo i risultati.

Questo quadro, nel 2018 è stato venduto all’asta da Christie’s per 432.500,00 $.

Perché? Why? Uai?

Ho cominciato a scrivere questo articolo il 27 agosto 2022, perché mi sono imbattuto una serie di foto generate da uno strumento in beta, di cui parlerò dopo e con il quale ho generato l’immagine in evidenza di questo post (a partire dal testo super fantasioso “beautiful artificial intelligence wallpaper for not scientific article”). Come potete vedere l’immagine prodotta è di grande qualità e completamente originale. Inoltre se giocate un poco con il testo possono venire fuori immagini di ogni tipo, talvolta disturbanti, tanto perché macabre o inquietanti, quanto per le varie implicazioni che si portano dietro le riflessioni che scaturiscono dalla loro visione.

Sembra proprio che microprocessori e silicio, stiano insediando una delle attività umane che sembrava distante ed intoccabile da parte degli avanzamenti tecnici, ovvero ciò che concerne l’attività artistica e la creatività. Alcuni sostengono che i lavoratori umani nel settore della creatività, saranno in un prossimo futuro, sostituiti da macchine.

Questi profili professionali sono solo alcuni che, si ipotizza, saranno sostituiti da automi, robot e algoritmi, basta fare una piccola ricerca sul web per capire come questa tendenza, sospinta dall’Agenda 2030 e dai finanziamenti per l’Industria 4.0, sembri ineluttabile.

“Ok, tutto molto bello, ma a che livello siamo ora?” ci si potrebbe chiedere.
Giusto per dirne una, nel 2018 è stato battuto all’asta un quadro creato da un’IA, ed è stato venduto per una cifra blu! Oltre 400.000 $.

Sfiorati sommariamente gli aspetti sociali e del lavoro, andiamo a capire, senza scendere a fondo nei dettagli, come fa un’intelligenza artificiale a svolgere il suo compito.

Un po’ di contesto tecnologico.
Come fa la macchina a fare quello che fa?

Per chi è a digiuno di intelligenza artificiale, machine learning, deep learning e compagnia, non temete, neanche io sono un esperto e tratterò quindi la cosa in maniera, non me ne vogliano gli esperti, senza tecnicismi che non padroneggerei appieno.

Con queste dovute premesse, passiamo a capire cosa c’è dietro un interfaccia che data una stringa testuale in input, ritorna in output un’immagine coerente con il testo, partendo col descrivere quello che di contesto c’è da sapere.

Questa immagine è stata generata con Midjourney. La chiave usata è “a fotorealistic fly on a ultra detailed spider net, on a cyan background made by random sequences of 1 and 0”

Iniziamo col dire che il concetto di creatività per una macchina è abbastanza diverso da quello umano. La creatività dell’IA è un’implementazione tecnica che scimmiotta alcuni aspetti della creatività umana, ma è un è un qualcosa di diverso, con le sue caratteristiche, i suoi pregi, i suoi difetti e i suoi campi di applicazione.

Come in altri ambiti dell’informatica, quando si cerca di automatizzare un’attività mediante lo sviluppo di un algoritmo, si fa riferimento (volenti o nolenti) a quello che avviene a livello biochimico e a quanto pare quantistico, nel nostro cervello. Cercherò di spiegare meglio questo concetto: anche a livello inconscio, quando si progettano cose, si scrivono programmi e si disegnano algoritmi, lo si fa a suon di materia grigia, di logica, di associazioni di idee e di concetti presenti nel proprio bagaglio culturale. Pertanto questi prodotti del nostro cervello in qualche modo lo rappresentano, ne rappresentano le connessioni e talvolta perfino gli stati emotivi … non starò raccontando nulla di nuovo agli psicologi forensi.

L’addestramento

Si intuisce, anche senza capire un’acca di informatica o di machine learning, che prima di poter rispondere con un’immagine ad un testo, è necessario che il nostro software sia addestrato per farlo.

Prima di diventare “bravo” a costruire immagini (o a svolgere qualsivoglia compito) un robot deve apprendere, cosa che normalmente si traduce in un periodo di tempo in cui si forniscono alla macchina milioni di casistiche del suo lavoro.

In questo modo la macchina sarà in grado di costruire (chiedo venia agli addetti ai lavori) la propria rete neurale, adesso in grado di svolgere il compito per la quale è stata addestrata.

Facciamo un esempio semplice semplice, che tra l’altro ha già un’applicazione reale in campo diagnostico.
Forniamo ad un’intelligenza artificiale milioni di immagini di un tessuto biologico (tratto ad esempio da una biopsia) e indichiamo in fase di addestramento alla macchina, quali immagini rappresentano un tessuto sano e quali un tessuto malato.

Fatto questo milioni di volte, la macchina impara a distinguere le due casistiche e a diagnosticare problemi di come farebbe il suo collega in carne, ossa e camice bianco, su tutte le immagini che riceve.

Un altro esempio è quello di un AI che è stata addestrata con i video corredati da descrizione testuale presenti sulla piattaforma Flickr. A cosa puntavano? A realizzare uno strumento in grado di descrivere ciò che succede nel video. Ci sono riusciti? La risposta giudicatela voi stessi, guardando il video.

Intelligenza artificiale in grado, dall’audio, di “indovinare” cosa sta succedendo in un video.

Text To Image

C’è un pletora di grandi aziende, start-up, progetti pilota, studi scientifici e ricerche universitarie che hanno dato il via alla creazione di strumenti in grado di fare il cosiddetto text to image. Soprattutto i giganti dell’Hi Tech, hanno dedicato enormi risorse a questo tipo di progetti, anche, manco a dirlo, Google con il suo Imagen.

Di seguito trovate immagini provenienti da strumenti disponibili gratuitamente online. Ho testato DeepAi.org, Craiyon, NightCafè, Wambo e Midjourney; questi ultimi due mi sono sembrati di gran lunga migliori sia in termini di qualità del risultato sia dal punto di vista dell’esperienza utente. Midjourney, il mio preferito, è l’unico disponibile attraverso Discord.

Date un’occhiata a queste immagini.

Generato con DeepAi.org

Questa immagine è stata prodotta a partire dal testo “The most effective human killer of last year” ovvero il l’assassino più efficace. Sembra che l’intelligenza artificiale faccia riferimento a problemi cardio-vascolari.

Generato con Midjourney

Qui abbiamo interrogato la nostra intelligenza artificiale chiedendo quale fosse il maggior killer di esseri umani degli ultimi 20 anni. Sembra che l’intelligenza artificiale si riferisca all’inquinamento.

Ho provato ad interrogare l’IA anche su temi più delicati

Questa immagine è stata prodotta con la chiave “White guy dreaming to be white.”
Questa curiosa e un poco tenebrosa è stata generata a partire dal testo “the one who will save humanity from auto-destruction”
“Black guy dreaming to be white” è stata la frase che ha prodotto l’immagine.
Questa, generata sempre con Craiyon, aveva come chiave “God enlightment”

Altre immagini generate con vari strumenti

Questa immagine è stata generata con NightCafe usando la chiave “Funny camel in artic”, ovvero cammello divertente nell’artico.
“Fox in love” generata con nightcafe.studio.
Artwork generato da intelligenza artificiale su wombo.art, con la chiave “Softair team vs dark zombies”
Qui ho chiesto a deepai.org di generare una palla da calcio con gli occhiali da sole.
Fox in love generata con un’intelligenza artificiale fornita da craiyon.com.
Qui ho chiesto a wombo.art di generare un meme con il testo “Mechanical Bear”.

Se questo articolo ti è piaciuto, sostienici condividendolo. Inoltre presto scriveremo di altre straordinarie applicazioni dell’intelligenza artificiale, per cui seguici sui nostri canali sociali.