image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di NVIDIA pensa già alle RTX 50 SUPER: ecco quando arriveranno NVIDIA pensa già alle RTX 50 SUPER: ecco quando arriveranno...
Immagine di Queste DRAM consumano il 20% in meno e performano di più Queste DRAM consumano il 20% in meno e performano di più...

Questa IA interpreta il linguaggio e crea immagini incredibili

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marco Doria

a cura di Marco Doria

Pubblicato il 25/05/2022 alle 15:30

Non è sicuramente la prima volta che sentiamo parlare di intelligenze artificiali in grado di realizzare immagini partendo da una descrizione testuale. Una delle più famose è DALL-E di OpenAI (irresistibile il nome che omaggia Dalì e il tenero Wall-E!), che crea immagini partendo da delle didascalie attraverso una rete neurale appositamente addestrata. Peccato che non sia disponibile al pubblico.

Esistono altri servizi, più o meno efficaci nella produzione di immagini tramite IA e interpretazione del testo, come Hotpot che crea delle opere d'arte partendo da una descrizione a scopo commerciale (tra le altre cose, è possibile creare NFT), ma niente sembra paragonarsi a quanto definito da Google come un sistema in grado di offrire "un livello senza precedenti di fotorealismo e una profonda comprensione del linguaggio".

imagen-231366.jpg
Chi resiste a un gatto sullo skate con un cappello creato da un'IA? - Fonte: Imagen

Stiamo parlando del modello di diffusione Imagen di cui potete leggere il paper ufficiale. Realizzato dal Brain Team di Google Research, anche questo sistema di intelligenza artificiale crea immagini partendo da un input di testo, con risultati davvero sorprendenti.

I ricercatori hanno creato DrawBench, un benchmark composto da 200 descrizioni testuali immesse in Imagen e altri modelli di confronto, fra cui DALL-E 2 e VQGAN+CLIP. Le immagini sono state valutate da un gruppo di persone che, a detta di Google, hanno preferito Imagen agli altri modelli, sia per la qualità dei campioni che della corrispondenza fra testo e immagine.

Nemmeno Imagen è al momento disponibile al pubblico, soprattutto perché il modello, come molti altri, è stato addestrato su grandi insiemi di dati ricavati dal web e non affidati a curatori, di conseguenza, alcuni dataset hanno introdotto elementi indesiderati, fra cui immagini pornografiche, linguaggio scurrile, stereotipi sociali negativi e razzismo. Dunque, al fine di prevenire utilizzi impropri del modello, i ricercatori hanno deciso di non renderlo disponibile pubblicamente, almeno per il momento.

In futuro, il gruppo auspica di riuscire a creare un framework che consenta un utilizzo responsabile del modello, in grado di bilanciare le verifiche esterne e i possibili rischi di un accesso aperto e senza limiti.

Al momento, potete provare Imagen in forma limitata, basta visitare il sito web e sperimentare il modello con alcune frasi preselezionate. I risultati sono davvero interessanti.

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Uso della VRAM ridotto all'osso con la nuova versione del DLSS
  • #2
    Anche Amazon nella rete del “NO IVA”: ecco gli affari nascosti
  • #3
    Uno YouTuber ha acquistato uno dei marchi più famosi del retrogaming
  • #4
    Questa è la tech che salverà le schede video da 8GB
  • #5
    Blocco diesel Euro 5 Nord Italia: tutto quello che c'è da sapere
  • #6
    Helldivers 2 trasforma le recensioni negative in DLC
Articolo 1 di 5
Queste DRAM consumano il 20% in meno e performano di più
L'industria delle memorie DRAM sta assistendo a una rivoluzione che potrebbe ridefinire i parametri di efficienza energetica e delle prestazioni.
Immagine di Queste DRAM consumano il 20% in meno e performano di più
Leggi questo articolo
Articolo 2 di 5
NVIDIA pensa già alle RTX 50 SUPER: ecco quando arriveranno
Le nuove RTX 50 SUPER debutteranno probabilmente al CES 2026. Le novità riguardano principalmente la VRAM, aumentata del 50% rispetto ai modelli base.
Immagine di NVIDIA pensa già alle RTX 50 SUPER: ecco quando arriveranno
16
Leggi questo articolo
Articolo 3 di 5
Incredibile ma vero: PNG si aggiorna dopo ben 22 anni
Rivoluzione PNG: dopo 22 anni arriva il supporto HDR, animazioni e metadati Exif nel nuovo formato che cambierà il web e la fotografia digitale.
Immagine di Incredibile ma vero: PNG si aggiorna dopo ben 22 anni
1
Leggi questo articolo
Articolo 4 di 5
WD_BLACK SN8100, l'SSD PCIe 5.0 più veloce sul mercato | Test & Recensione
Il nuovo SSD flagship di Sandisk combina prestazioni estreme ed efficienza energetica, per un risultato a diro poco impressionante.
Immagine di WD_BLACK SN8100, l'SSD PCIe 5.0 più veloce sul mercato | Test & Recensione
2
Leggi questo articolo
Articolo 5 di 5
Lenovo ThinkPad X9 14 Aura Edition: la rivoluzione dei ThinkPad | Test & Recensione
Un ThinkPad che rompe con la tradizione: design in alluminio, display OLED e intelligenza artificiale in un corpo ultrasottile e raffinato.
Immagine di Lenovo ThinkPad X9 14 Aura Edition: la rivoluzione dei ThinkPad | Test & Recensione
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.