Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Microsoft Teams anti-assenteismo, presto dirà se sei davvero in ufficio Microsoft Teams anti-assenteismo, presto dirà se sei davver...
Immagine di Gli agenti IA falliscono da soli, ma eccellono con l'uomo Gli agenti IA falliscono da soli, ma eccellono con l'uomo...

Arriva la nuova generazione di Gemini: ecco 1.5 Pro, più potente di Ultra

Google ha annunciato il rilascio di Gemini 1.5 Pro, il nuovo modello della famiglia Gemini 1.5 che ha dimostrato performance migliori di Ultra.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marina Londei

a cura di Marina Londei

Editor

Pubblicato il 16/02/2024 alle 10:45

Dopo l'annuncio di Gemini 1.0 Ultra disponibile in AI Studio e Vertex AI, Google ha presentato la nuova generazione del modello: Gemini 1.5. La nuova famiglia di modelli offre performance molto più avanzate anche rispetto a 1.0 Ultra, diventando più efficiente soprattutto in fase di training. 

Il primo modello della famiglia sarà Gemini 1.5 Pro, un modello multimodale di grandezza media ottimizzato per scalare su una grande varietà di task, con performance simili a 1.0 Ultra, il modello più grande di Google. 

Gemini 1.5 Pro viene rilasciato con una context window di 128.000 token, ma gli sviluppatori possono utilizzarlo in preview privata su AI Studio e Vertex AI anche nella versione con 1 milione di token. 

Il modello è stato costruito basandosi sul lavoro di ricerca in merito a Transformer e MoE (Mixture-of-Experts): la prima è una rete neurale basata sul meccanismo di "self-attention" per modellare le relazioni tra le parole di una frase; la seconda è una rete neurale che, invece di comportarsi come un unico componente, si divide in reti più piccole e più "esperte" per un dato task. 

A seconda dell'input, la rete MoE attiva solo le sotto-reti rilevanti; questa specializzazione migliora notevolmente l'efficienza e la velocità del modello. 

Immagine id 7573

"Le nostre ultime innovazioni nell'architettura dei modelli consentono a Gemini 1.5 di apprendere compiti complessi più rapidamente e di mantenere la qualità, oltre a essere più efficiente nell'addestramento e nell'esecuzione" afferma Demis Hassabis, CEO di Google DeepMind. "Queste efficienze stanno aiutando i nostri team a iterare, formare e fornire versioni più avanzate di Gemini più velocemente che mai, e stiamo lavorando a ulteriori ottimizzazioni".

Le capacità di Gemini 1.5 Pro

Il nuovo modello è in grado di processare grandi volumi di informazioni in una sola esecuzione: nei test di Google, Gemini 1.5 Pro è stato in grado di elaborare senza sforzi 1 ora di video, 11 ore di audio e una codebase con più di 30.000 righe di codice.

Il modello ha dimostrato ottime capacità di ragionamento: date le 402 pagine di trascrizione della missione Apollo 11, Gemini 1.5 Pro è riuscito a ragionare sulle conversazioni, gli eventi e i dettagli specificati nel documento. 

Dato un film muto di 44 minuti, il modello è stato in grado di analizzare dettagliatamente i punti salenti della trama e gli eventi, identificando le singole scene a partire da un prompt.

Il modello offre performance ottimali anche per task di problem-solving su grandi codebase. Dato un prompt con più di 100.000 righe di codice, Gemini 1.5 Pro è stato in grado di spiegare il funzionamento delle diverse porzioni di codice e suggerire delle modifiche per migliorarle.

Immagine id 9190

Le performance del modello

Stando ai benchmark di Google, Gemini 1.5 Pro offre performance migliori di 1.0 Pro nell'87% dei test effettuati, comprensivi di task di comprensione di testo, codice, immagini, audio e video. 

Il nuovo modello mantiene performance elevate anche aumentando il numero di token. Nel test Needle In A Haystack (letteralmente "ago nel pagliaio"), una valutazione in cui una piccola porzione di testo che contiene un fatto di interesse viene inserita in un lungo blocco di testo, 1.5 Pro è riuscito a trovare la porzione di testo desiderata nel 99% dei casi, con testi lunghi fino a 1 milione di token. 

Gemini 1.5 Pro ha dimostrato anche ottime capacità di apprendimento "in-context", ovvero la capacità di imparare una nuova abilità analizzando informazioni presenti in un prompt molto lungo, senza fine tuning aggiuntivo. 

Fornitogli in input un manuale di grammatica per il Kalamang, una lingua parlata da meno di 200 persone in tutto il mondo, il modello ha imparato a tradurre l'inglese in Kalamang con un livello simile a quello di una persona che lo impara dallo stesso contenuto.

Pixabay
artificial intelligence

Al momento Gemini 1.5 Pro è disponibile solo per gli sviluppatori e i clienti enterprise su AI Studio e Vertex AI. Google prevede di rilasciare il modello con context window di 128.000 nei prossimi mesi, e in seguito prevede di introdurre diversi piani di utilizzo a pagamento che partono dalla versione base e arrivano fino a 1 milione di token. 

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Unieuro non si ferma: le promozioni del Black Friday continuano
  • #2
    Windows 26 riprende l’eredità di Vista e 7, ma con stile
  • #3
    Addio certezze: il diamante non è più il numero uno
  • #4
    Amazon abbandona Android per la pirateria
  • #5
    Steam Machine sarà la morte di PlayStation e Xbox?
  • #6
    LEFANT scatenato per il Black Friday: robot scontati fino al 72%
Articolo 1 di 5
Gli agenti IA falliscono da soli, ma eccellono con l'uomo
Gli agenti IA falliscono nei compiti professionali, ma con il feedback umano i tassi di completamento aumentano fino al 70% in 20 minuti di collaborazione.
Immagine di Gli agenti IA falliscono da soli, ma eccellono con l'uomo
Leggi questo articolo
Articolo 2 di 5
Microsoft Teams anti-assenteismo, presto dirà se sei davvero in ufficio
Da dicembre, Microsoft Teams sui client Windows e macOS introdurrà il rilevamento automatico della posizione tramite rete Wi-Fi. La funzionalità, nata per l'efficienza, è subito vista come uno strumento anti-assenteismo che pone un rischio per la privacy.
Immagine di Microsoft Teams anti-assenteismo, presto dirà se sei davvero in ufficio
4
Leggi questo articolo
Articolo 3 di 5
Stipendi fermi? Il 78% dei lavoratori italiani è infatti insoddisfatto
Dipendenti italiani tra retribuzioni ferme e welfare poco personalizzato: quasi l'80% ritiene inadeguato il proprio stipendio, mentre cresce l'interesse per l'IA.
Immagine di Stipendi fermi? Il 78% dei lavoratori italiani è infatti insoddisfatto
1
Leggi questo articolo
Articolo 4 di 5
Strategia oltre l'IA: cinque priorità per il 2026
L'IA dominerà le agende IT nel 2025, ma non deve oscurare le tecnologie emergenti di secondo piano che meritano attenzione.
Immagine di Strategia oltre l'IA: cinque priorità per il 2026
1
Leggi questo articolo
Articolo 5 di 5
Warehouse, la trasformazione silenziosa dell’IA che sta cambiando tutto
L'**IA Generativa** e **Agentic AI** rivoluzionano la **supply chain**, potenziando **efficienza**, **agilità** e **resilienza** (magazzini). La GenAI velocizza i processi, l'Agentic AI gestisce le criticità.
Immagine di Warehouse, la trasformazione silenziosa dell’IA che sta cambiando tutto
2
Leggi questo articolo
Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.