L'intelligenza artificiale generativa si trova di fronte a un collo di bottiglia infrastrutturale che sta costringendo i principali attori del settore a contingentare drasticamente l'accesso ai propri strumenti. Google e OpenAI hanno annunciato tagli significativi alle richieste di generazione per i loro rispettivi servizi, Nano Banana Pro e Sora, citando una domanda che ha letteralmente mandato in sovraccarico le loro infrastrutture GPU.

OpenAI ha ridotto le generazioni video giornaliere per gli utenti gratuiti di Sora a sei al giorno, una limitazione annunciata direttamente da Bill Peebles, responsabile del progetto Sora presso l'azienda di San Francisco. La giustificazione fornita è stata tanto diretta quanto eloquente: "Le nostre GPU si stanno sciogliendo", una formulazione colloquiale che traduce in termini concreti la pressione sui data center dell'azienda. A differenza delle precedenti restrizioni temporanee imposte durante i picchi di traffico, questa volta Peebles non ha specificato alcuna scadenza per il ripristino delle condizioni precedenti.

La strategia di monetizzazione emerge chiaramente dalla comunicazione di OpenAI: gli utenti potranno acquistare generazioni aggiuntive secondo necessità, un modello freemium che si allinea alla più ampia spinta commerciale dell'azienda. Gli abbonati a ChatGPT Plus e ChatGPT Pro mantengono invece i loro limiti invariati, sebbene OpenAI non abbia specificato pubblicamente quali siano esattamente questi tetti per i piani premium. La differenziazione tra utenti gratuiti e paganti si fa così più netta, con l'accesso prioritario alle risorse computazionali che diventa di fatto un servizio a pagamento.

Le GPU si stanno sciogliendo: la frase di Bill Peebles fotografa il problema infrastrutturale dell'AI generativa

Google non è da meno nel restringere l'accesso gratuito ai propri servizi AI. Il gigante di Mountain View ha ridotto le generazioni di immagini giornaliere su Nano Banana Pro da tre a due al giorno per gli utenti non paganti, un cambiamento rilevato per primo dalla testata 9to5Google. Il servizio, lanciato appena la scorsa settimana, ha evidentemente registrato volumi di utilizzo superiori alle previsioni. L'azienda ha inoltre avvertito che i limiti potrebbero cambiare frequentemente e senza preavviso, una prassi ormai consolidata dopo il rilascio di servizi che riscuotono particolare successo presso il pubblico.

Parallelamente, Google sembra stia limitando anche l'accesso degli utenti gratuiti a Gemini 3 Pro, il suo modello linguistico di fascia alta. La mossa suggerisce una strategia coordinata per spingere gli utenti più esigenti verso i tier di abbonamento a pagamento, garantendo al contempo sostenibilità operativa per le infrastrutture cloud che alimentano questi servizi. Il costo computazionale dell'inferenza AI, particolarmente per modelli multimodali capaci di generare video e immagini ad alta risoluzione, rappresenta infatti una delle principali sfide economiche per i provider.