Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Non puoi parlare se non sei competente, la Cina blocca gli influencer Non puoi parlare se non sei competente, la Cina blocca gli i...
Immagine di Perché l'AGI potrebbe essere impossibile da raggiungere Perché l'AGI potrebbe essere impossibile da raggiungere...

Google presenta Ironwood: supercalcolo AI senza compromessi

Google Cloud lancia Ironwood, TPU di settima generazione con prestazioni 4x superiori, e nuove istanze Axion per inferenza AI e carichi di lavoro agentici.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor

Pubblicato il 06/11/2025 alle 14:00

La notizia in un minuto

  • Google Cloud lancia Ironwood, la settima generazione di TPU capace di interconnettere fino a 9.216 chip in un singolo pod con 1,77 petabyte di memoria condivisa, offrendo 118 volte più potenza rispetto ai principali concorrenti
  • Anthropic utilizzerà fino a un milione di TPU per gestire Claude, mentre aziende come Vimeo e ZoomInfo hanno già registrato miglioramenti dal 30% al 60% nelle prestazioni grazie alle nuove istanze Axion basate su architettura Arm
  • L'innovazione segna il passaggio all'era dell'inferenza, dove l'obiettivo non è più solo addestrare modelli ma garantire risposte in tempo reale a milioni di utenti con costi sostenibili e ROI medio del 353% in tre anni
Riassunto generato con l'IA. Potrebbe non essere accurato.

L'intelligenza artificiale sta attraversando una trasformazione fondamentale che gli addetti ai lavori definiscono "l'era dell'inferenza". Non si tratta più soltanto di addestrare modelli sempre più sofisticati, ma di garantire che questi sistemi possano rispondere a milioni di utenti in tempo reale, con costi sostenibili e prestazioni costanti. È in questo contesto che Google Cloud ha annunciato il lancio di Ironwood, la settima generazione delle sue Tensor Processing Unit (TPU), chip personalizzati progettati specificamente per le esigenze dell'intelligenza artificiale moderna. Insieme a Ironwood arrivano anche nuove istanze virtuali basate su processori Axion, l'architettura Arm sviluppata internamente da Google per ottimizzare i carichi di lavoro generici che supportano le applicazioni AI.

La portata di questa innovazione è tangibile: Anthropic, l'azienda che sviluppa Claude, uno dei modelli linguistici più avanzati al mondo, ha annunciato l'intenzione di utilizzare fino a un milione di TPU per gestire le proprie operazioni. James Bradbury, responsabile del computing di Anthropic, ha sottolineato come i miglioramenti nelle prestazioni di inferenza e nella scalabilità dell'addestramento di Ironwood permetteranno all'azienda di crescere in modo efficiente mantenendo la velocità e l'affidabilità che i clienti richiedono. Non sono solo le grandi aziende a beneficiarne: startup come Lightricks stanno già testando questa tecnologia per potenziare i loro modelli generativi multimodali open source.

Ti potrebbe interessare anche

youtube play
Guarda su youtube logo

Il cuore dell'innovazione di Ironwood risiede nella sua capacità di interconnessione senza precedenti. Un singolo "pod", ovvero l'unità base di calcolo distribuito, può collegare fino a 9.216 chip che lavorano come un unico supercomputer. Per rendere l'idea: se ogni persona sulla Terra eseguisse un calcolo al secondo, servirebbero diversi giorni per eguagliare quanto questo sistema elabora in un solo secondo. La tecnologia Inter-Chip Interconnect (ICI) proprietaria di Google permette a questi chip di comunicare a una velocità di 9,6 terabit al secondo, eliminando i colli di bottiglia che tipicamente rallentano i sistemi di calcolo distribuito.

Immagine id 75114

Questa capacità di memoria condivisa equivale all'archiviazione di circa 40.000 film in alta definizione o al testo di milioni di libri, tutti accessibili istantaneamente da migliaia di processori simultaneamente. È proprio questa caratteristica che consente ai modelli di intelligenza artificiale più complessi di operare senza le tipiche interruzioni causate dal dover continuamente recuperare dati da memorie più lente. La differenza rispetto alla concorrenza è netta: secondo i dati forniti da Google, Ironwood offre 118 volte più potenza di calcolo FP8 ExaFLOPS rispetto al principale concorrente, un divario che rappresenta non un semplice miglioramento incrementale ma un cambio di scala radicale.

L'affidabilità è un altro elemento cruciale in questa architettura. La tecnologia Optical Circuit Switching (OCS) agisce come un sistema nervoso dinamico che reindirizza istantaneamente il traffico dati in caso di interruzioni, garantendo che i servizi continuino a funzionare senza soluzione di continuità. Secondo un recente rapporto IDC, i clienti dell'AI Hypercomputer di Google (il sistema integrato di supercalcolo che include le TPU) hanno registrato in media un ritorno sull'investimento del 353% nell'arco di tre anni, una riduzione del 28% dei costi IT e team IT più efficienti del 55%.

Ma l'intelligenza artificiale moderna non vive solo di acceleratori specializzati. I flussi di lavoro agentici, sistemi AI che orchestrano multiple operazioni in sequenza, richiedono anche processori general-purpose efficienti per gestire preparazione dei dati, ingestion e hosting delle applicazioni. È qui che entrano in gioco le nuove istanze Axion, basate su architettura Arm e progettate da Google per offrire fino al doppio del rapporto prezzo-prestazioni rispetto alle VM x86 comparabili della generazione attuale.

Un pod Ironwood può accedere a 1,77 petabyte di memoria condivisa ad alta velocità

La storia di Google nel campo del silicio personalizzato è lunga e interconnessa con l'evoluzione stessa dell'intelligenza artificiale moderna. La prima TPU, sviluppata dieci anni fa, ha reso possibile l'invenzione dell'architettura Transformer otto anni fa – la stessa che alimenta praticamente tutti i modelli AI contemporanei, da ChatGPT a Gemini. Questa tradizione include anche le Video Coding Unit per YouTube e cinque generazioni di chip Tensor per dispositivi mobili, tutti esempi di come la co-progettazione profonda tra ricerca sui modelli, software e hardware sotto lo stesso tetto possa generare innovazioni impossibili da ottenere altrimenti.

Il portfolio Axion si è ora ampliato con tre opzioni: N4A per carichi di lavoro general-purpose come microservizi e database open source, C4A per prestazioni consistentemente elevate con networking fino a 100 Gbps, e la nuova C4A metal, la prima istanza bare-metal basata su Arm di Google, dedicata a carichi di lavoro specializzati come sviluppo Android, sistemi automobilistici in-car e simulazioni complesse. Questa varietà permette alle aziende di ottimizzare costi e prestazioni selezionando l'istanza più adatta alle caratteristiche specifiche di ciascun carico di lavoro.

Sul fronte software, Google sta potenziando l'intero stack per massimizzare le capacità hardware di Ironwood. Il Cluster Director in Google Kubernetes Engine ora offre funzionalità avanzate di manutenzione e consapevolezza della topologia per cluster altamente resilienti. MaxText, il framework open source ad alte prestazioni per LLM, è stato migliorato per facilitare l'implementazione delle più recenti tecniche di ottimizzazione come il Supervised Fine-Tuning e il Generative Reinforcement Policy Optimization. Per l'inferenza, il supporto migliorato per le TPU in vLLM consente agli sviluppatori di passare tra GPU e TPU con modifiche minime alla configurazione.

Fonte dell'articolo: www.google.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Tornano le ricariche gratis per chi compra Tesla
  • #2
    Luminosità e contrasto: la "terza via" per un televisore ideale
  • #3
    Huawei lancia nuovi PC con CPU e OS cinesi proprietari
  • #4
    Scoperto il trucco mentale per recuperare i ricordi
  • #5
    ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
  • #6
    Fusa la prima rete quantistica a 18 nodi: svolta dalla Cina
Articolo 1 di 5
Perché l'AGI potrebbe essere impossibile da raggiungere
No, non è quello che pensi e, soprattutto è un vettore, non una variabile booleana
Immagine di Perché l'AGI potrebbe essere impossibile da raggiungere
12
Leggi questo articolo
Articolo 2 di 5
Non puoi parlare se non sei competente, la Cina blocca gli influencer
La Cina impone agli influencer che trattano temi sensibili (salute, diritto, finanza, educazione) la competenza certificata e la trasparenza sui contenuti AI, esercitando un controllo politico.
Immagine di Non puoi parlare se non sei competente, la Cina blocca gli influencer
8
Leggi questo articolo
Articolo 3 di 5
QNAP lancia il NAS ZFS TS-h2477AXU-RP: 24 bay e PCIe Gen 5
QNAP ha presentato il TS-h2477AXU-RP, un NAS enterprise ZFS a 24 bay con CPU AMD Ryzen 7000 e slot M.2 PCIe Gen 5.
Immagine di QNAP lancia il NAS ZFS TS-h2477AXU-RP: 24 bay e PCIe Gen 5
1
Leggi questo articolo
Articolo 4 di 5
Come funzionano i giudici IA dei sistemi
La sfida nell'implementazione aziendale dell'IA non è l'intelligenza dei modelli, ma la capacità di definire e misurare la qualità dei risultati.
Immagine di Come funzionano i giudici IA dei sistemi
Leggi questo articolo
Articolo 5 di 5
L'IA aziendale può andare oltre il RAG?
Analisi di dati strutturati insieme ai strutturati per superare i limiti dei sistemi tradizionali su interrogazioni aggregate di grandi volumi.
Immagine di L'IA aziendale può andare oltre il RAG?
2
Leggi questo articolo
Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.