Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
% Black Friday
%
Accedi a Xenforo
Immagine di FLUX.2 è il Gemini Banana per le aziende
Business
Immagine di Il vero nodo dell’AI è l’inference: come Crusoe e Groq cambiano le regole del gioco Il vero nodo dell’AI è l’inference: come Crusoe e Groq ...
Immagine di 5G SA, qualcosa si muove, 90 operatori sono in modalità "soft launch" 5G SA, qualcosa si muove, 90 operatori sono in modalità "so...

FLUX.2 è il Gemini Banana per le aziende

Black Forest Labs lancia FLUX.2: nuovi modelli per generazione e editing immagini con riferimenti multipli, testo migliorato e risoluzione fino a 4 megapixel.

Avatar di Antonino Caffo

a cura di Antonino Caffo

Editor @Tom's Hardware Italia

Pubblicato il 28/11/2025 alle 14:43

La notizia in un minuto

  • Black Forest Labs lancia FLUX.2, un sistema completo di generazione e modifica immagini con architettura open-core che combina modelli proprietari e componenti Apache 2.0, evitando il vendor lock-in
  • Il modello Flux.2 [Dev] da 32 miliardi di parametri supporta condizionamento multi-riferimento fino a dieci immagini simultanee, con prestazioni superiori ai competitor e costi fino a 8 volte inferiori rispetto a Gemini 3 Pro
  • L'architettura integra latent flow matching con transformer derivato da Mistral-3, offrendo rendering testuale migliorato e spazio latente avanzato per flussi di lavoro professionali e scalabilità operativa

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

La startup tedesca Black Forest Labs ha lanciato FLUX.2, un sistema completo che integra capacità di creazione e modifica di contenuti visuali attraverso quattro modelli distinti. L'annuncio arriva in un momento di forte fermento nel settore, con rilasci recenti anche da parte di Google e Anthropic, ma si distingue per un approccio ibrido che bilancia trasparenza e commercializzazione. La nuova architettura introduce funzionalità avanzate come il condizionamento multi-riferimento, output ad alta fedeltà e un rendering testuale notevolmente migliorato, elementi che rispondono alle esigenze concrete di flussi di lavoro professionali.

L'aspetto più rilevante della release riguarda la strategia di distribuzione cosiddetta "open-core": mentre alcuni componenti rimangono proprietari, Black Forest Labs ha reso disponibile sotto licenza Apache 2.0 il modulo Flux.2 VAE, un autoencoder variazionale che rappresenta il cuore computazionale dell'intero sistema. Questo componente, responsabile della compressione delle immagini in uno spazio latente e della loro successiva ricostruzione ad alta risoluzione, offre alle aziende un vantaggio strategico non indifferente: la possibilità di adottare lo stesso spazio latente utilizzato dai modelli commerciali di BFL nelle proprie infrastrutture interne, evitando il cosiddetto vendor lock-in e garantendo interoperabilità tra sistemi diversi.

Ti potrebbe interessare anche

youtube play
Guarda su youtube logo

La famiglia di modelli FLUX.2 si articola in cinque varianti con caratteristiche e licenze differenziate. Flux.2 [Pro] rappresenta il livello prestazionale più elevato, ottimizzato per latenza minima e massima fedeltà visiva, disponibile attraverso endpoint commerciali. Flux.2 [Flex] espone invece parametri configurabili come il numero di passaggi di campionamento e la scala di guida, permettendo agli sviluppatori di calibrare il compromesso tra velocità e qualità. La versione più interessante per l'ecosistema aperto è Flux.2 [Dev], un checkpoint da 32 miliardi di parametri con peso aperto che integra generazione e modifica in un unico modello, supportando il condizionamento multi-riferimento senza richiedere pipeline separate.

Trasparenza e controllo commerciale convivono in un equilibrio strategico

I benchmark pubblicati dall'azienda mostrano prestazioni significative rispetto ai concorrenti. Nelle comparazioni dirette, FLUX.2 [Dev] ha ottenuto un tasso di vittoria del 66,6% nella generazione text-to-image contro alternative open-weight come Qwen-Image (51,3%) e Hunyuan Image 3.0 (48,1%). Nelle attività di editing con riferimento singolo, il tasso sale al 59,8%, mentre per l'editing multi-riferimento raggiunge il 63,6%. Un secondo benchmark basato su punteggi ELO ha posizionato le varianti FLUX.2 nella fascia 1030-1050, con costi per immagine compresi tra 2 e 6 centesimi di dollaro, risultando tra le opzioni più convenienti nella loro categoria qualitativa.

Sul fronte dei prezzi, FLUX.2 [Pro] viene fatturato circa 0,03 dollari per megapixel di input e output combinati, rendendo una generazione standard 1024×1024 da un megapixel costosa tre centesimi. Per contestualizzare, il recente Gemini 3 Pro Image Preview di Google, soprannominato "Nano Banana Pro", applica tariffe basate su token che si traducono in 0,134 dollari per immagini 1K-2K e 0,24 dollari per immagini 4K, risultando significativamente più costoso, con un rapporto che arriva fino a 8 volte per risoluzioni elevate.

L'architettura tecnica di FLUX.2 si basa su un modello di latent flow matching che combina un transformer a flusso rettificato con un modello vision-language derivato da Mistral-3 da 24 miliardi di parametri. Quest'ultimo fornisce ancoraggio semantico e comprensione contestuale, mentre il transformer gestisce struttura spaziale, rappresentazione dei materiali e comportamento dell'illuminazione. Il rinnovamento dello spazio latente rappresenta uno degli aggiornamenti più sostanziali: il VAE di FLUX.2 integra progressi nella qualità di ricostruzione e nell'allineamento semantico, superando il tradizionale trilemma tra apprendibilità, qualità e compressione che affligge molti autoencoder.

La funzionalità più significativa è il supporto multi-riferimento: FLUX.2 può elaborare fino a dieci immagini di riferimento mantenendo coerenza di identità, dettagli di prodotto o elementi stilistici nell'output finale. Questa capacità risponde a esigenze concrete in ambiti come visualizzazione di prodotti, creazione di contenuti brandizzati, storyboarding e fotografia virtuale. I miglioramenti nella tipografia affrontano una sfida persistente per le architetture basate su diffusione e flusso: il sistema genera testo leggibile, layout strutturati ed elementi UI con affidabilità superiore, ampliando i casi d'uso dove testo e immagine definiscono congiuntamente il risultato finale.

Una storia recente

Black Forest Labs nasce nel 2024 dalla visione di Robin Rombach, Patrick Esser e Andreas Blattmann, i creatori originali di Stable Diffusion, in un momento di turbolenza per la comunità open-source dell'IA generativa dopo la loro uscita da Stability AI. L'azienda ha raccolto 31 milioni di dollari in finanziamenti seed guidati da Andreessen Horowitz, con il supporto di figure come Brendan Iribe e Michael Ovitz. Il primo rilascio importante, FLUX.1, aveva introdotto un'architettura da 12 miliardi di parametri che rapidamente guadagnò reputazione per qualità paragonabile o superiore a competitor closed-source come Midjourney v6 e DALL·E 3.

Per i team aziendali responsabili dell'ingegneria AI, orchestrazione e gestione dati, FLUX.2 introduce implicazioni operative concrete. La disponibilità simultanea di endpoint gestiti e checkpoint con peso aperto permette percorsi di integrazione flessibili, riducendo il sovraccarico di sviluppo quando si gestiscono output specifici per brand o con coerenza identitaria. Le capacità multi-riferimento e il supporto a risoluzioni espanse diminuiscono la necessità di pipeline di fine-tuning personalizzate. Per i team focalizzati su scalabilità operativa, la struttura della famiglia di prodotti offre caratteristiche di latenza prevedibili nel livello Pro, mentre il livello Flex consente controllo diretto sui parametri di campionamento, allineandosi con ambienti che richiedono tuning prestazionale rigoroso.

Gli stakeholder della data engineering beneficiano dell'architettura latente migliorata e della fedeltà di ricostruzione potenziata. Rappresentazioni di immagini prevedibili e di alta qualità riducono gli oneri di pulizia dati nei flussi dove gli asset generati alimentano sistemi analitici o pipeline di automazione creativa. Poiché FLUX.2 consolida funzioni text-to-image e modifica immagini in un singolo modello, semplifica i punti di integrazione e riduce la complessità dei flussi dati attraverso storage, versionamento e livelli di monitoraggio. Per i team di sicurezza, l'approccio open-core introduce considerazioni relative a controllo degli accessi, governance dei modelli e monitoraggio dell'utilizzo API, con gli endpoint ospitati che permettono applicazione centralizzata delle politiche di sicurezza.

Il rilascio di FLUX.2 segna un'evoluzione verso sistemi di generazione immagini più prevedibili, scalabili e controllabili, adatti all'uso operazionale oltre la sperimentazione. L'equilibrio tra offerte completamente gestite e checkpoint open-weight mantiene il modello open-core di BFL estendendone la rilevanza ai flussi creativi commerciali, con guadagni misurabili in coerenza multi-riferimento, rendering testuale e qualità dello spazio latente che posizionano il sistema come alternativa concreta per organizzazioni con requisiti rigorosi di budget, governance e prestazioni.

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Ti potrebbe interessare anche

5G SA, qualcosa si muove, 90 operatori sono in modalità "soft launch"
1

Business

5G SA, qualcosa si muove, 90 operatori sono in modalità "soft launch"

Di Antonino Caffo
Il vero nodo dell’AI è l’inference: come Crusoe e Groq cambiano le regole del gioco

Business

Il vero nodo dell’AI è l’inference: come Crusoe e Groq cambiano le regole del gioco

Di Giacomo Barone
Nuove opzioni per lo storage ad alte prestazioni: l'all-flash punta a blindare i dati dell'AI

Business

Nuove opzioni per lo storage ad alte prestazioni: l'all-flash punta a blindare i dati dell'AI

Di Valerio Porcu
C'è il rischio che la tua azienda diventi una AI-company, senza usare mai l'IA
1

Business

C'è il rischio che la tua azienda diventi una AI-company, senza usare mai l'IA

Di Antonino Caffo
Google vuole vendere chip AI a Meta, Nvidia trema
1

Business

Google vuole vendere chip AI a Meta, Nvidia trema

Di Valerio Porcu
Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.