image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Il MacBook low-cost avrà queste limitazioni Il MacBook low-cost avrà queste limitazioni...
Immagine di RDNA 5 AT0, la top AMD torna per i gamer RDNA 5 AT0, la top AMD torna per i gamer...

Questa IA interpreta il linguaggio e crea immagini incredibili

Advertisement

Avatar di Marco Doria

a cura di Marco Doria

@Tom's Hardware Italia

Pubblicato il 25/05/2022 alle 15:30
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Non è sicuramente la prima volta che sentiamo parlare di intelligenze artificiali in grado di realizzare immagini partendo da una descrizione testuale. Una delle più famose è DALL-E di OpenAI (irresistibile il nome che omaggia Dalì e il tenero Wall-E!), che crea immagini partendo da delle didascalie attraverso una rete neurale appositamente addestrata. Peccato che non sia disponibile al pubblico.

Esistono altri servizi, più o meno efficaci nella produzione di immagini tramite IA e interpretazione del testo, come Hotpot che crea delle opere d'arte partendo da una descrizione a scopo commerciale (tra le altre cose, è possibile creare NFT), ma niente sembra paragonarsi a quanto definito da Google come un sistema in grado di offrire "un livello senza precedenti di fotorealismo e una profonda comprensione del linguaggio".

imagen-231366.jpg
Chi resiste a un gatto sullo skate con un cappello creato da un'IA? - Fonte: Imagen

Stiamo parlando del modello di diffusione Imagen di cui potete leggere il paper ufficiale. Realizzato dal Brain Team di Google Research, anche questo sistema di intelligenza artificiale crea immagini partendo da un input di testo, con risultati davvero sorprendenti.

I ricercatori hanno creato DrawBench, un benchmark composto da 200 descrizioni testuali immesse in Imagen e altri modelli di confronto, fra cui DALL-E 2 e VQGAN+CLIP. Le immagini sono state valutate da un gruppo di persone che, a detta di Google, hanno preferito Imagen agli altri modelli, sia per la qualità dei campioni che della corrispondenza fra testo e immagine.

Nemmeno Imagen è al momento disponibile al pubblico, soprattutto perché il modello, come molti altri, è stato addestrato su grandi insiemi di dati ricavati dal web e non affidati a curatori, di conseguenza, alcuni dataset hanno introdotto elementi indesiderati, fra cui immagini pornografiche, linguaggio scurrile, stereotipi sociali negativi e razzismo. Dunque, al fine di prevenire utilizzi impropri del modello, i ricercatori hanno deciso di non renderlo disponibile pubblicamente, almeno per il momento.

In futuro, il gruppo auspica di riuscire a creare un framework che consenta un utilizzo responsabile del modello, in grado di bilanciare le verifiche esterne e i possibili rischi di un accesso aperto e senza limiti.

Al momento, potete provare Imagen in forma limitata, basta visitare il sito web e sperimentare il modello con alcune frasi preselezionate. I risultati sono davvero interessanti.

Le notizie più lette

#1
Perplexity Computer: ho speso 200 euro in 12 ore così non devi farlo tu
2

Business

Perplexity Computer: ho speso 200 euro in 12 ore così non devi farlo tu

#2
RDNA 5 AT0, la top AMD torna per i gamer
9

Hardware

RDNA 5 AT0, la top AMD torna per i gamer

#3
Il MacBook low-cost avrà queste limitazioni
3

Hardware

Il MacBook low-cost avrà queste limitazioni

#4
Un noto integratore cerebrale accorcia la vita degli uomini
1

Scienze

Un noto integratore cerebrale accorcia la vita degli uomini

#5
SwitchBot AI Hub rivoluziona la smart home con OpenClaw

Altri temi

SwitchBot AI Hub rivoluziona la smart home con OpenClaw

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

RDNA 5 AT0, la top AMD torna per i gamer
9

Hardware

RDNA 5 AT0, la top AMD torna per i gamer

Di Antonello Buzzi
Il MacBook low-cost avrà queste limitazioni
3

Hardware

Il MacBook low-cost avrà queste limitazioni

Di Marco Pedrani
Recensione Terramaster F2-425, NAS 2 bay con CPU Intel x86

Hardware

Recensione Terramaster F2-425, NAS 2 bay con CPU Intel x86

Di Marco Pedrani
NVIDIA mantiene la promessa: Shield TV si aggiorna ancora
4

Hardware

NVIDIA mantiene la promessa: Shield TV si aggiorna ancora

Di Antonello Buzzi
Il mouse best seller Logitech crolla di prezzo: -52% oggi

Offerte e Sconti

Il mouse best seller Logitech crolla di prezzo: -52% oggi

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • SosHomeGarden
  • Aibay
  • Coinlabs

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.