La nuova IA Stable Diffusion XL Turbo genera immagini in tempo reale mentre scrivi

Stability AI, ha svelato Stable Diffusion XL Turbo, un modello di IA capace di generare, in pochi secondi, immagini a partire da un prompt scritto.

Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author

Martedì scorso, Stability AI, ha svelato Stable Diffusion XL Turbo, un innovativo modello di sintesi d'immagine basato sull'intelligenza artificiale, capace di generare rapidamente immagini a partire da un prompt scritto.

La sua straordinaria velocità lo ha reso un prodotto chiave per l'azienda, che lo ha proclamato come un sistema di generazione d'immagini "in tempo reale".

In effetti, la capacità di Stable Diffusion XL Turbo di trasformare rapidamente anche immagini provenienti da sorgenti quali una webcam, ha destato parecchio interesse nel pubblico.

La vera innovazione di SDXL Turbo, infatti, risiede nella sua abilità di produrre output d'immagini in un singolo passaggio, riducendo significativamente i 20/50 passaggi richiesti dal suo predecessore.

Questo notevole miglioramento è stato ottenuto grazie a una tecnica denominata "Adversarial Diffusion Distillation" (ADD). ADD utilizza la distillazione dei punteggi, consentendo al modello di apprendere da modelli esistenti di sintesi d'immagini e di differenziare tra immagini reali e generate, migliorando il realismo dei risultati.

Stability ha analizzato approfonditamente il funzionamento del modello in un recente articolo di ricerca, focalizzandosi sulla tecnica ADD. Uno dei principali vantaggi di SDXL Turbo è la sua somiglianza con le Generative Adversarial Networks (GAN), specialmente nella capacità di produrre immagini in un singolo passaggio.

Sebbene le immagini di SDXL Turbo non raggiungano lo stesso dettaglio di quelle generate dai maggiori passaggi di SDXL, i risultati sono notevoli in termini di efficienza.

Per esempio, su un Nvidia RTX 3060, SDXL Turbo è in grado di generare un'immagine 1024x1024 in soli 3 step in circa 4 secondi, rispetto ai 26,4 secondi impiegati da SDXL per un'immagine a 20 step con dettagli simili.

Attualmente, SDXL Turbo è disponibile esclusivamente per uso non commerciale, una decisione che ha suscitato qualche critica nella community di Stable Diffusion.