Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Se lavori al computer il tuo destino è segnato, l'AI ti sostituirà Se lavori al computer il tuo destino è segnato, l'AI ti sos...
Immagine di Bastano cinque mosse per passare dal caos dei prompt alla chiarezza nell'uso dell'IA Bastano cinque mosse per passare dal caos dei prompt alla ch...

Arriva la nuova generazione di Gemini: ecco 1.5 Pro, più potente di Ultra

Google ha annunciato il rilascio di Gemini 1.5 Pro, il nuovo modello della famiglia Gemini 1.5 che ha dimostrato performance migliori di Ultra.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marina Londei

a cura di Marina Londei

Editor

Pubblicato il 16/02/2024 alle 10:45

Dopo l'annuncio di Gemini 1.0 Ultra disponibile in AI Studio e Vertex AI, Google ha presentato la nuova generazione del modello: Gemini 1.5. La nuova famiglia di modelli offre performance molto più avanzate anche rispetto a 1.0 Ultra, diventando più efficiente soprattutto in fase di training. 

Il primo modello della famiglia sarà Gemini 1.5 Pro, un modello multimodale di grandezza media ottimizzato per scalare su una grande varietà di task, con performance simili a 1.0 Ultra, il modello più grande di Google. 

Gemini 1.5 Pro viene rilasciato con una context window di 128.000 token, ma gli sviluppatori possono utilizzarlo in preview privata su AI Studio e Vertex AI anche nella versione con 1 milione di token. 

Il modello è stato costruito basandosi sul lavoro di ricerca in merito a Transformer e MoE (Mixture-of-Experts): la prima è una rete neurale basata sul meccanismo di "self-attention" per modellare le relazioni tra le parole di una frase; la seconda è una rete neurale che, invece di comportarsi come un unico componente, si divide in reti più piccole e più "esperte" per un dato task. 

A seconda dell'input, la rete MoE attiva solo le sotto-reti rilevanti; questa specializzazione migliora notevolmente l'efficienza e la velocità del modello. 

Immagine id 7573

"Le nostre ultime innovazioni nell'architettura dei modelli consentono a Gemini 1.5 di apprendere compiti complessi più rapidamente e di mantenere la qualità, oltre a essere più efficiente nell'addestramento e nell'esecuzione" afferma Demis Hassabis, CEO di Google DeepMind. "Queste efficienze stanno aiutando i nostri team a iterare, formare e fornire versioni più avanzate di Gemini più velocemente che mai, e stiamo lavorando a ulteriori ottimizzazioni".

Le capacità di Gemini 1.5 Pro

Il nuovo modello è in grado di processare grandi volumi di informazioni in una sola esecuzione: nei test di Google, Gemini 1.5 Pro è stato in grado di elaborare senza sforzi 1 ora di video, 11 ore di audio e una codebase con più di 30.000 righe di codice.

Il modello ha dimostrato ottime capacità di ragionamento: date le 402 pagine di trascrizione della missione Apollo 11, Gemini 1.5 Pro è riuscito a ragionare sulle conversazioni, gli eventi e i dettagli specificati nel documento. 

Dato un film muto di 44 minuti, il modello è stato in grado di analizzare dettagliatamente i punti salenti della trama e gli eventi, identificando le singole scene a partire da un prompt.

Il modello offre performance ottimali anche per task di problem-solving su grandi codebase. Dato un prompt con più di 100.000 righe di codice, Gemini 1.5 Pro è stato in grado di spiegare il funzionamento delle diverse porzioni di codice e suggerire delle modifiche per migliorarle.

Immagine id 9190

Le performance del modello

Stando ai benchmark di Google, Gemini 1.5 Pro offre performance migliori di 1.0 Pro nell'87% dei test effettuati, comprensivi di task di comprensione di testo, codice, immagini, audio e video. 

Il nuovo modello mantiene performance elevate anche aumentando il numero di token. Nel test Needle In A Haystack (letteralmente "ago nel pagliaio"), una valutazione in cui una piccola porzione di testo che contiene un fatto di interesse viene inserita in un lungo blocco di testo, 1.5 Pro è riuscito a trovare la porzione di testo desiderata nel 99% dei casi, con testi lunghi fino a 1 milione di token. 

Gemini 1.5 Pro ha dimostrato anche ottime capacità di apprendimento "in-context", ovvero la capacità di imparare una nuova abilità analizzando informazioni presenti in un prompt molto lungo, senza fine tuning aggiuntivo. 

Fornitogli in input un manuale di grammatica per il Kalamang, una lingua parlata da meno di 200 persone in tutto il mondo, il modello ha imparato a tradurre l'inglese in Kalamang con un livello simile a quello di una persona che lo impara dallo stesso contenuto.

Pixabay artificial intelligence

Al momento Gemini 1.5 Pro è disponibile solo per gli sviluppatori e i clienti enterprise su AI Studio e Vertex AI. Google prevede di rilasciare il modello con context window di 128.000 nei prossimi mesi, e in seguito prevede di introdurre diversi piani di utilizzo a pagamento che partono dalla versione base e arrivano fino a 1 milione di token. 

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Apple ci ha messo solo 18 anni a capire come funzionano le suonerie
  • #2
    Rubati 16 miliardi di account: cambiate le vostre password!
  • #3
    Nintendo Switch 2 è da record, ma quasi nessuno acquista i giochi
  • #4
    AdBlock su Android, ora puoi installare le estensioni su Chrome
  • #5
    Sembrava sconfitto e invece adesso tutti tornano al cloud privato
  • #6
    Microsoft dichiara guerra ai driver vecchi eliminandoli dai vostri PC
Articolo 1 di 5
Bastano cinque mosse per passare dal caos dei prompt alla chiarezza nell'uso dell'IA
La scelta dei framework di orchestrazione può sembrare complessa, ma seguire le migliori pratiche consigliate dagli esperti può garantire il successo.
Immagine di Bastano cinque mosse per passare dal caos dei prompt alla chiarezza nell'uso dell'IA
Leggi questo articolo
Articolo 2 di 5
Se lavori al computer il tuo destino è segnato, l'AI ti sostituirà
L'ingegnere software lancia l'allarme: cresce il divario tra le promesse dell'IA e la realtà dei risultati ottenuti nella pratica quotidiana.
Immagine di Se lavori al computer il tuo destino è segnato, l'AI ti sostituirà
Leggi questo articolo
Articolo 3 di 5
ChatGPT per Gmail, OpenAI punta agli utenti Google Workspace
ChatGPT sperimenta l'integrazione con Gmail e Google Calendar per riassumere email, creare eventi e gestire programmi direttamente con l'IA.
Immagine di ChatGPT per Gmail, OpenAI punta agli utenti Google Workspace
Leggi questo articolo
Articolo 4 di 5
Sembrava sconfitto e invece adesso tutti tornano al cloud privato
Broadcom lancia VMware Cloud Foundation 9.0: la piattaforma per il nuovo modello di private cloud che unisce sicurezza, controllo dei costi e agilità.
Immagine di Sembrava sconfitto e invece adesso tutti tornano al cloud privato
5
Leggi questo articolo
Articolo 5 di 5
Sorvegliare i lavoratori con l'AI è più semplice ma occhio ai limiti legali
L’uso dell’intelligenza artificiale per monitorare i lavoratori è possibile, ma richiede precisi limiti legali e normativi: trasparenza, proporzionalità, tutela della privacy e conformità al GDPR e all’AI Act europeo.
Immagine di Sorvegliare i lavoratori con l'AI è più semplice ma occhio ai limiti legali
Leggi questo articolo
Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.