Il supercomputer più potente del mondo è basato su ARM

Lunedì 22 giugno è stata aggiornata la classifica TOP500 dei supercomputer, e si può ben dire che sia una data da ricordare per gli appassionati di hardware. La vetta, il primo posto, non è facile da conquistare. Non si tratta solo di implementare un numero di core o un numero di acceleratori, alias GPU, più elevato della "concorrenza". Potremmo dire che in realtà si tratta di trovare la giusta interconnessione tra i vari elementi computazionali destinati al calcolo, o trovare il giusto compromesso energetico per poter sfamare questi agglomerati di nodi.

I giapponesi del Centro di Scienze Computazionali Riken (R-CCS) di Kobe, in collaborazione con Fujitsu, sono riusciti a creare un supercomputer che è risultato il più potente del mondo. Fugaku è il nome di battesimo, in onore del Monte Fuji (Fujisan, la più alta e sacra montagna giapponese). L'accostamento è ragionato e meritato, viste le capacità di calcolo di questa super-super-(e ancora super)-macchina e l'offerta pratica che è in grado di offrire ai programmatori, potendo essere utilizzata da una più vasta tipologia di calcoli, analogia con l'estesa area alla base della montagna sacra. Nella cultura nipponica non si accostano i simboli sacri tutti i giorni, quindi è facile capire come questo non sia puro marketing ma segno del fatto che qui c'è sostanza, molta sostanza.

Il sistema è basato sul processore A64FX SoC (System-on-Chip) di Fujitsu, CPU a 48+4 core con architettura ARM v8.2A SVE 512bit, prima novità in questo panorama fatta di calcolatori x86. A64FX è prodotto con il processo a 7nm FinFET di TSMC, ha una frequenza base di 2,00GHz con una capacità di salire fino a 2,20GHz e 32GB di memoria HBM2 (High Bandwith Memory), allocata insieme sul chip. L'interconnessione proprietaria sviluppata da Fujitsu è la Torus Fusion Interconnect D (ToFu D) a maglia toroidale 6D, che permette ad ogni singolo chip di scambiare dati con una larghezza di banda teorica di 100GB/s, prestazione che alla pratica (ora) si ferma a 560Gbps.

L'installazione completa di Fugaku prevede 158976 CPU A64FX, per un consumo globale (intero sistema) di 28335KW (28,3MW), a fronte di un dispiegamento milionario di core. Abbiamo infatti 396 rack per 384 nodi, per un subtotale di 152064 nodi, e 36 rack per 192 nodi, per un subtotale di 6912 nodi. Ogni nodo può contare su 48 core di calcolo e da 2 a 4 core gestionali, insieme a 32GB di memoria HBM2. I numeri finali parlano chiaro: 158976 nodi, un totale di 7630848 core di calcolo e 5087232 GB di memoria HBM2 con 163PB di banda.

Le prestazioni sono di assoluto primato, in grado di raggiungere 415,5 PetaFLOPS con benchmark HPL (High Performance Linpack), risultato per cui ha ottenuto il record mondiale. Nei calcoli a doppia precisione FP64 Fugaku è in grado di raggiungere i 537 PetaFLOPS, mentre in quelli a singola precisione FP32 siamo in classe esascalare con quota 1,07 ExaFLOPS. Nei calcoli FP16 si raggiungono invece i 2,15 ExaFLOPS, in quelli Int8 la vetta è a 4,30 ExaFLOPS. Numeri, appunto, esascalari che fanno capire l'immensa fruibilità negli scenari tipici di calcoli per machine learning e Intelligenza Artificiale (AI).

Ricordiamolo: l'architettura ARM v8.2-A SVE (Scalable Vector Extensions) è in grado di offrire una scalabilità eccezionale oltre che una potenza "fuori di testa", il tutto senza ausilio di acceleratori grafici supplementari. Niente GPU, insomma. Il nuovo numero due al mondo (ex leader) è il famoso Summit di IBM sviluppato per il Laboratorio Nazionale di Oak Ridge (ORNL) in Tennessee (USA), installato nel 2018, che con Linpack (HPL) si ferma a quota 148,8 PetaFLOPS.

I numeri sintetici però non bastano a descrivere al meglio la supremazia di Fugaku. La capacità di calcolo è senza dubbio un buon parametro di misura per la contestualizzazione. Più si eccelle, meglio è. Ma riteniamo che l'interconnessione ToFu D e l'implementazione sul chip di memoria HBM2 sia altrettanto favorevole alla praticità di questi stratosferici risultati. In unione con la natura ultra scalabile del processore A64FX, e quindi dell'intero nodo di calcolo, la vera e sostanziale perla di Fugaku è la semplificazione e scalabilità raggiunta con questo particolare ecosistema. Come numeri assoluti siamo certi che il 2021 porterà altri sistemi in vetta alla classifica mondiale: in prima linea ci sarà appunto il sostituto di Summit, Frontier, sempre installato presso il Laboratorio Nazionale di Oak Ridge in Tennessee. La praticità dei calcoli per Fugaku però sarà ancora (forse) determinante. Intanto i progetti che possono appoggiarsi su cotanta potenza di calcolo sono correlati alla ricerca sul COVID-19.

Memoria SanDisk Ultra da 128GB classe 10/A1 con il 63% di sconto su Amazon: meno di 22€.