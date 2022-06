Un gruppo di ricercatori dell’Università di Bologna e Cineca ha effettuato alcune analisi su un cluster di supercomputer RISC-V a otto nodi e 32 core, evidenziando come i SoC SiFive Freedom U740 possano eseguire applicazioni di supercomputing con consumi relativamente bassi. L’architettura open-source RISC-V permette di avere un equilibrio molto competitivo tra prestazioni, consumi e costi, rendendola adatta a vari tipi di carichi di lavoro, anche per il calcolo ad alte prestazioni (HPC).

Per le rilevazioni è stato utilizzato il cluster Monte Cimone, composto da quattro blade a doppia scheda in un form factor 1U e costruito da E4, un’azienda italiana di HPC. Le macchine 1U impiegano due schede madri HiFive Unmatched developer di SiFive equipaggiate con il SoC multicore Freedom U740, che integra quattro core U74 a 1,4GHz e un core S7 con la tecnologia proprietaria Mix+Match, oltre a 2MB di cache L2. Inoltre, ogni piattaforma dispone di 16GB di memoria DDR4-1866 e di un’unità SSD NVMe da 1TB.

Il team di ricercatori ha effettuato il porting di NFS, LDAP e del job scheduler SLURM su RISC-V e successivamente ha installato il plugin ExaMon dedicato al campionamento dei dati, un broker per la gestione del livello di trasporto e un database per l’archiviazione. Inoltre, sono stati eseguiti benchmark HPL e Stream per misurare le prestazioni GFLOPS e la larghezza di banda della memoria.

Photo Credit: E4

Photo Credit: E4

Le prestazioni teoriche massime di un SoC Freedom U740 dovrebbero essere di 4 GFLOP, ma ogni nodo ha raggiunto solo 1,86 GFLOPS in HPL, il che significa che la capacità di calcolo di picco di un cluster a otto nodi dovrebbe essere dell’ordine di 14,88 GFLOPS (ipotizzando una scalatura lineare perfetta). L’intero cluster ha ottenuto una prestazione di picco sostenuta di 12,65 GFLOPS, pari all’85% del picco raggiungibile estrapolato.

Per quanto riguarda la larghezza di banda della memoria, ogni nodo dovrebbe fornire circa 14,928 GB/s utilizzando un modulo DDR4-1866. Tuttavia, non ha mai superato i 7.760 MB/s, il che non costituisce di certo un buon risultato. I valori registrati dal benchmark in upstream sono ancora meno impressionanti: un carico di lavoro a 4 thread ha raggiunto solo una larghezza di banda non superiore al 15,5% di quella di picco disponibile, ben al di sotto ai risultati di altri cluster.

I risultati ottenuti hanno evidenziato prestazioni inferiori alle aspettative causate dalle capacità mediocri dell’U740, ma anche la mancanza di software ha giocato un ruolo importante. Per quanto riguarda il futuro, si prevede un miglioramento dello stack software, l’aggiunta del supporto RDMA, l’implementazione di una gestione dinamica dell’energia e del calore e l’utilizzo di acceleratori basati su RISC-V.

Per ciò che concerne l’hardware, SiFive può realizzare SoC con un massimo di 128 core ad alte prestazioni e destinati a carichi di lavoro di data center e HPC. Con la maggiore diffusione di questi prodotti, si spera che gli sviluppatori siano incoraggiati a realizzare software per l’ISA RISC-V.