Il supercomputer Aurora tocca i 2 ExaFLOPS grazie a Ponte Vecchio

Le GPU per il calcolo Ponte Vecchio di Intel saranno più potenti del previsto, portando il super computer Aurora a sfondare la barriera dei 2 ExaFLOPS.

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Editor

Aurora dell'Argonne National Laboratory doveva essere il primo supercomputer con prestazioni medie di oltre 1 ExaFLOPS nel benchmark Linpack, ma, dopo essere stato rimandato, questo titolo è stato lasciato al supercomputer Frontier. Tuttavia, Aurora sarà il primo supercomputer da due ExaFLOPS del settore grazie alle prestazioni superiori fornite dalle GPU di calcolo Ponte Vecchio di Intel. Inoltre, Ponte Vecchio sarà alla base del primo sistema exascale europeo e Intel dichiara che fornirà tecnologie per una macchina ZettaFLOPS entro il 2027.

Poiché le CPU Sapphire Rapids di Intel e le GPU Ponte Vecchio si stanno avvicinano al loro lancio, l'azienda ha ora una migliore comprensione delle loro performance, motivo per cui ha aumentato l'obiettivo prestazionale di Aurora a 2 ExaFLOPS FP64 (Rpeak) da circa 1 ExaFLOPS. All'improvviso, Aurora diventa un rivale del supercomputer El Capitan del Lawrence Livermore National Laboratory, che è destinato a raggiungere un throughput di 2 ExaFLOPS nel 2023.

Il Supercomputer Aurora ha una storia piuttosto tortuosa. Il sistema è stato annunciato per la prima volta nel 2015, doveva essere basato sugli acceleratori Xeon Phi di Intel e fornire circa 180 PetaFLOPS nel 2018. Ma poi Intel ha tagliato il suo Xeon Phi a favore delle GPU di calcolo, ha dovuto rinegoziare l'accordo con l'Argonne National Laboratory e fornire un sistema ExaFLOPS nel 2021. In seguito, la società ha dovuto posticipare nuovamente la consegna del sistema a causa del ritardo del suo processo di fabbricazione a 7nm (ora chiamato Intel 4) e della necessità di produrre le Compute Tile di Ponte Vecchio sia internamente (utilizzando quello che ora viene chiamato Intel 4) che esternamente (usando il nodo N5) di TSMC.

La tecnologia Intel a 7nm ha dovuto essere riprogettata nel tentativo di raggiungere gli obiettivi prefissati. All'inizio di quest'anno Intel ha indicato che la versione rinnovata del suo processo a 7nm utilizza ampiamente la litografia Extreme UltraViolet (EUV) che elimina l'uso del multipatterning (con quattro o più esposizioni), che semplifica la produzione e riduce il numero di difetti. Poiché le stime iniziali di Intel per Ponte Vecchio includevano un Compute Tile che avrebbe dovuto essere realizzato su un nodo diverso, queste non sono più valide. Apparentemente, con un modulo di calcolo prodotto utilizzando N5 di TSMC (e Intel 4 in seguito), Ponte Vecchio può raggiungere performance notevolmente superiori rispetto alla versione iniziale. Ciò è condizionato da una serie di motivi, tra cui un clock maggiore del Compute Tile e un numero maggiore di EU attive al suo interno.

La GPU per il calcolo Ponte Vecchio di Intel verrà utilizzata prima per il supercomputer Aurora, ma successivamente verrà impiegata anche per altri sistemi di calcolo ad alte prestazioni (HPC). I primi supercomputer europei sono impostati per utilizzare il System-On-Chip (SoC) Rhea di SiPearl progettato appositamente nell'ambito della European Processor Initiative. Si prevede che il chip includerà fino a 72 core ARM Neoverse Zeus interconnessi tramite una rete mesh, ma avrà comunque bisogno di un acceleratore HPC per raggiungere gli obiettivi prestazionali. SiPearl ha deciso di utilizzare le GPU Ponte Vecchio di Intel all'interno del nodo HPC del sistema e per questo motivo adotterà le oneAPI di Intel nel suo stack software.