Tom's Hardware Italia Tom's Hardware
Schede Grafiche

AMD Radeon Instinct MI60 con GPU Vega a 7 nanometri per IA e machine learning

All’evento Next Horizon di AMD non si è parlato solamente della seconda generazione di CPU EPYC, ma anche di Radeon Instinct, le GPU che l’azienda statunitense propone per il mondo dei datacenter e più in particolare per compiti di machine learning e intelligenza artificiale. David Wang, nuovo boss della divisione RTG dopo la fuoriuscita di Raja Koduri, si è concentrato sulla nuova GPU Vega a 7 nanometri, la prima al mondo realizzata con questo processo produttivo.

La nuova Radeon Instinct MI60, disponibile da questo trimestre, è dotata proprio di questa nuova incarnazione di Vega, che conta su 13,2 miliardi di transistor in un’area di 331 mm2 per garantire prestazioni di più di 1,25 volte maggiori all’attuale Radeon Instinct MI25 a parità di consumo – oppure un consumo il 50% inferiore alla stessa frequenza di lavoro.

La MI60 è, secondo AMD, la scheda PCI Express con le prestazioni FP64 e FP32 più veloci al mondo: si parla di 7,4 TFLOPs per i calcoli FP64 nel settore HPC e 14,7 TFLOPS in quelli FP32 per compiti di allenamento di intelligenze artificiali. Nel caso dell’inferenza AMD indicata prestazioni pari a 118 TOPS (INT4).

La GPU è accompagnata da 32 GB di memoria HBM2 con ECC, in grado di garantire un bandwidth di 1 TB/s. È anche la prima scheda a supportare il PCI Express 4.0, per un bandwidth bidirezionale di 64 GB/s tra CPU e GPU. Sono inoltre presenti dei collegamenti Infinity Fabric che consentono di collegare più GPU assicurando un bandwidth di 100 GB/s per collegamento.

Questo permette prestazioni decisamente superiori alla precedente MI25 e uno scaling migliorato con più GPU. Secondo AMD la nuova nata è in grado di sopravanzare la Tesla V100 di Nvidia in formato PCI Express o comunque offrire prestazioni di livello simile in molteplici scenari. Insieme alla Instinct MI60, AMD ha introdotto anche una versione minore chiamata MI50, di cui potete vedere le specifiche nella seguente tabella:

  Instinct MI60
Instinct MI50
Compute Unit 64 60
Stream Processor 4096 3840
Prestazioni di picco half precision (FP16) 29.5 TFLOPs 26.8 TFLOPs
Prestazioni di picco singola precisione (FP32) 14.7 TFLOPs 13.4 TFLOPs
Prestazioni di picco doppia precisione (FP64) 7.4 TFLOPs 6.7 TFLOPs
Prestazioni di picco INT8 58.9 TFLOPs 53.6 TFLOPs
Capacità di memoria 32GB 16GB
Tipo memoria (GPU) HBM2 HBM2
Bandwidth di memoria 1024GB/s 1024GB/s

Oltre al nuovo hardware, Wang ha parlato anche di ROCm 2.0, nuova versione della piattaforma open source per il calcolo accelerato che include nuove librerie matematiche, un supporto ai framework più ampio e operazioni di deep learning ottimizzate.

Per quanto riguarda il futuro, dopo MI60 sarà la volta di MI-NEXT (è un semplice nome in codice), un progetto che garantirà maggiori prestazioni, connettività e compatibilità software. Al momento però non sono stati divulgati dettagli più precisi.