Nvidia è già al lavoro sulle GPU IA Rubin: arriveranno a fine 2025

Nvidia pianifica la produzione di massa delle GPU Vera Rubin con tecnologia a 3nm di TSMC per la fine del 2025.

Avatar di Giulia Di Venere

a cura di Giulia Di Venere

Editor

Secondo quanto riferito dal noto analista Ming-Chi Kuo, le GPU Vera Rubin di nuova generazione di Nvidia per applicazioni AI e HPC entreranno in produzione di massa alla fine del 2025. Nvidia si concentrerà sul consumo energetico delle sue GPU per data center con i processori R100 basati sull'architettura Rubin, poiché l'estrema quantità di energia richiesta dai processori basati su Blackwell rappresenta un problema per i data center.

Le GPU Vera Rubin di Nvidia saranno realizzate su uno dei processi produttivi a 3nm di TSMC - molto probabilmente utilizzando una versione personalizzata dell'N3P, che migliora le prestazioni. Secondo quanto riferito, adotteranno un packaging CoWoS-L di dimensioni pari a circa 4 volte il reticolo, anche se l'azienda non ha ancora finalizzato il design dell'interposer, afferma l'analista. Il pacchetto consentirà a Nvidia di equipaggiare la sua GPU R100 con otto stack HBM4.

Uno degli obiettivi di progettazione delle GPU Rubin di Nvidia è quello di tenere sotto controllo il consumo energetico. La GPU B200 di Nvidia può essere configurata per consumare fino a 1000W di potenza, mentre la soluzione GB200, composta da due GPU B200 e una CPU Grace, consuma fino a 2700W. Un tale consumo energetico rende difficile per i data center alimentare e raffreddare grandi cluster di queste GPU di calcolo, quindi resta da vedere se Nvidia riuscirà effettivamente a ridurre il consumo energetico aumentando tangibilmente le prestazioni rispetto ai prodotti basati su Blackwell, o se invece si concentrerà sull'efficienza delle prestazioni.

Nvidia dovrebbe iniziare la produzione di massa dei processori R100 nel quarto trimestre del 2025, quindi le soluzioni di sistema e rack basate sulle GPU Rubin dell'azienda entreranno in produzione nella prima metà del 2026, secondo l'analista. Di conseguenza, possiamo aspettarci che le macchine basate su R100 arriveranno nei data center reali non prima della metà del 2026.