image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Migliori RAM DDR5 (novembre 2025) Migliori RAM DDR5 (novembre 2025)...
Immagine di Migliori password manager (novembre 2025) Migliori password manager (novembre 2025)...

Google VideoPoet: la rivoluzione nell'IA per la creazione video

VideoPoet di Google, ha rivoluzionato le IA aprendo la strada alla generazione di video attraverso prompt basati su testo.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author

Pubblicato il 02/01/2024 alle 13:00

Google, nel corso del 2023, ha presentato l'innovativo PaLM 2 e i modelli linguistici Gemini, sottolineando la natura multimodale della sua intelligenza artificiale. VideoPoet, però, ha posto Google direttamente sul podio, in quanto è la prima grande azienda a presentare un'intelligenza artificiale in grado di generare video.

I modelli linguistici analoghi a GPT-4 di ChatGPT hanno fino ad ora eccelso principalmente nella produzione di testi, ma VideoPoet di Google cambia completamente le carte in tavola, aprendo la strada alla generazione di video attraverso prompt basati su testo.

La differenza chiave di VideoPoet, rispetto alle IA che generano brevi video molto simili a delle GIF, risiede nella capacità di creare scene con ampi movimenti, superando i limiti dei suoi predecessori. 

Basta descrivere una scena, anche estremamente fantasiosa, e in pochi secondi si otterrà un video pronto per la visualizzazione. Chi ha sperimentato generatori d'immagini basati sull'IA come Midjourney o DALL-E 3 conoscerà già la dinamica di VideoPoet, il quale può, inoltre, modificare contenuti video già esistenti, riempiendo vuoti o eseguendo altre manipolazioni richieste.

Nonostante Google abbia sostenuto startup come Runway nel campo della generazione di video basati sull'IA, VideoPoet è frutto degli sforzi interni dell'azienda e ha coinvolto ben 31 ricercatori della sezione Google Research.

Dalla descrizione fornita da Google, VideoPoet si distingue dai generatori convenzionali di testo-immagine e testo-video. A differenza di modelli come Midjourney, VideoPoet non si affida a un modello di diffusione per generare immagini da rumore casuale, garantendo una rappresentazione più realistica del movimento e della coerenza temporale, fondamentali per i contenuti video.

Questo modello si basa sulla tecnologia di base di ChatGPT e Google Bard, prevedendo non solo come le parole si uniscono per formare frasi, ma anche frammenti di video e audio, oltre al testo.

Il processo di addestramento è stato intensivo, coinvolgendo la traduzione di immagini, frame video e clip audio in un linguaggio comune, chiamato Token. Il risultato? VideoPoet è in grado di prevedere i Token video come un modello LLM prevederebbe i Token di testo.

Le capacità di VideoPoet vanno oltre la generazione di video da testo, permettendo modifiche, applicazione di stili e cambiamenti di movimento su video esistenti. Google ha dimostrato la versatilità di VideoPoet con esempi di un procione che balla in vari stili.

Nonostante Google abbia mostrato esempi delle capacità di VideoPoet, non ha annunciato una data di rilascio o un modello di accesso. Considerando la complessità computazionale delle immagini e dei video generati dall'IA, è probabile che il modello venga offerto tramite un sistema di abbonamento come altri generatori simili. 

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Dite addio all'hack più famoso per attivare Windows 11
  • #2
    Un supercomputer rivela la vera forma dei nuclei atomici
  • #3
    Scoperto un pianeta candidato perfetto per la vita
  • #4
    DJI Neo 2: il selfie drone tascabile diventa quasi perfetto | Test & Recensione
  • #5
    Windows: 10 cose che il 99% delle persone non conosce
  • #6
    Gli affari sulle CPU ci sono già! AMD conviene ora più che mai
Articolo 1 di 5
Migliori password manager (novembre 2025)
I password manager ci aiutano a gestire le nostre password in modo più sicuro e meno caotico. Ecco i migliori in circolazione.
Immagine di Migliori password manager (novembre 2025)
Leggi questo articolo
Articolo 2 di 5
Migliori RAM DDR5 (novembre 2025)
In questa guida alle migliori RAM DDR5 presenti sul mercato cercheremo di suggerirvi diversi prodotti per costruire il vostro PC.
Immagine di Migliori RAM DDR5 (novembre 2025)
1
Leggi questo articolo
Articolo 3 di 5
Migliori stampanti 3D (novembre 2025)
Sul mercato esistono un gran numero di stampanti 3D: scopriamo quali sono le migliori, sia per qualità di stampe che per le vostre necessità.
Immagine di Migliori stampanti 3D (novembre 2025)
Leggi questo articolo
Articolo 4 di 5
Startup da 1 miliardo, ma l’AI era manuale: esplode il caso
Fireflies, startup di trascrizione AI valutata 1 miliardo di dollari, ha ammesso che i primi servizi erano gestiti manualmente da esseri umani.
Immagine di Startup da 1 miliardo, ma l’AI era manuale: esplode il caso
1
Leggi questo articolo
Articolo 5 di 5
TikTok amplia le integrazioni: debutta Amazon Music
TikTok integra Amazon Music consentendo agli utenti di condividere brani, album, playlist e statistiche di ascolto tramite un pulsante dedicato nell'app.
Immagine di TikTok amplia le integrazioni: debutta Amazon Music
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.