Tom's Hardware Italia
Schede Grafiche

Nvidia presenta DGX-2, “la GPU più grande al mondo”

Non solo Quadro GV100 alla GTC 2018, Nvidia ha presentato anche DGX-2, nuova versione del suo sistema per accelerare la ricerca nel campo dell'intelligenza artificiale. Clicca per ingrandire Laddove la prima versione aveva otto Tesla V100 da 16 GB in un singolo chassis per offrire più di 960 TFLOPs di potenza grazie a 40.960 CUDA core, […]

Non solo Quadro GV100 alla GTC 2018, Nvidia ha presentato anche DGX-2, nuova versione del suo sistema per accelerare la ricerca nel campo dell'intelligenza artificiale.

nvidia dgx 2 03
Clicca per ingrandire

Laddove la prima versione aveva otto Tesla V100 da 16 GB in un singolo chassis per offrire più di 960 TFLOPs di potenza grazie a 40.960 CUDA core, DGX-2 raggiunge una potenza fino a 2 PetaFLOPS grazie alla presenza di sedici Tesla V100 con 32 GB di memoria.

Il sistema integra fino a 1,5 TB di memoria RAM, connettività InfiniBand o 100GBe (fino a otto) e due processori Xeon Platinum. Ah, non mancano 30 TB di archiviazione NVMe, espandibile a 60 TB. Il consumo si attesta attorno ai 10 kW, mentre il peso è di 160 chilogrammi.

nvidia dgx 2 02
Clicca per ingrandire

DXG-2 è anche il primo sistema a usare la tecnologia Nvidia NVSwitch, una nuova interconnessione flessibile garantita da uno switch composto da 2 miliardi di transistor che permette una comunicazione "chip to chip" a 300 GB/s.

nvidia nvswitch 03

Insieme a NVLink2, NVSwitch permette di "unire" insieme le 16 GPU creando una singola unità coesa con spazio di memoria unificato, creando quella che il CEO di Nvidia ha definito "la GPU più grande al mondo". Di conseguenza il sistema offre un totale di 512 GB di memoria HBM2 che mettono a disposizione un throughput fino a 14,4 TB/s. Inoltre c'è la possibilità di accedere a un totale di 81.920 CUDA core.

nvidia dgx 2 01
Clicca per ingrandire

Il nuovo sistema è stato progettato per consentire agli sviluppatori di espandere la dimensione delle loro reti neurali. Nvidia ha spiegato che DGX-2 è in grado di completare il processo di allenamento per FAIRSEQ – un modello di rete neurale per la traduzione linguistica – 10 volte più rapidamente di un sistema DGX-1, riducendo i tempi a meno di 2 giorni anziché 15.

nvidia nvswitch 02
Clicca per ingrandire
nvidia nvswitch 01
Clicca per ingrandire

Il boss di Nvidia, Jen Hsun-Huang, ha spiegato che DGX-2 ha 12 NVSwitch (216 porte) e ogni switch ha 18 connessioni NVLink a 8 bit per un bandwidth bidirezionale complessivo di 900 GB/s. Insomma, un mostro di potenza. DGX-2 sarà disponibile al prezzo di 399mila dollari.

Durante la conferenza il dirigente ha anche annunciato una partnership con ARM per integrare la propria architettura open-source Deep Learning Accelerator (NVLDA) nella piattaforma Project Trillium di ARM per il machine learning, permettendo ai produttori di chip per l'IoT di integrare l'intelligenza artificiale nei loro prodotti.

Arriva anche il supporto all'accelerazione tramite le GPU Nvidia di Kubernetes, strumento open source di orchestrazione e gestione di container.

nvidia auto autonoma

Segnaliamo inoltre DRIVE Constellation Simulation System, una configurazione multi-server dedicata ai partner per il testing di veicoli autonomi, in modo che possano percorrere miliardi di chilometri in modalità virtuale, senza per forza mettere veicoli veri su strada.

Durante la conferenza Nvidia ha anche mostrato come una persona umana seduta a casa propria su una postazione di guida e con un visore di realtà virtuale possa, in teoria, guidare una vera automobile a distanza. Si tratta però ancora di un progetto di ricerca.

nvidia orin
Clicca per ingrandire

Infine, il CEO di Nvidia ha parlato del successore della piattaforma per la guida autonoma Drive Pegasus: si chiamerà Drive Orin ed essenzialmente sarà formato da due Drive Pegasus combinati in un singolo package molto più piccolo.