Le APU Fusion in un HPC, prove tecniche di futuro

AMD e Penguin Computing hanno installato Altus A2A00 al Sandia National Labs di Albuquerque. Si tratta di un sistema HPC dotato di APU della famiglia Llano. Le due aziende collaborano per capire le potenzialità delle soluzioni di calcolo eterogenee con unità grafiche integrate sullo stesso die della...

Usare le APU AMD per soluzioni HPC (high performance computing) si può. Penguin Computing, in collaborazione con AMD, ha realizzato il primo cluster al mondo con APU della serie A e lo ha installato con successo presso i Sandia National Labs di Albuquerque, New Mexico.

Il sistema - chiamato Altus A2A00 - è dotato di 104 rack 2U, ciascuno con una APU quad-core e 320/400 stream processor (AMD parla di A8-3850, altre fonti sono meno precise). Altus A2A00 è in grado di raggiungere i 59,6 Teraflops di potenza. Ogni rack supporta fino a 64 GB di memoria DDR3-1600 o DDR3-1866, e offre otto slot per la rimozione a caldo di hard disk da 3,5". 

Sono disponibili diverse opzioni di connettività, come una soluzione QDR InfiniBand 40Gbps, una scheda di rete Ethernet 10Gbps e soluzioni dual o quad Ethernet da 1Gbps. Non mancano slot PCIe per collegare schede aggiuntive, porte SATA, USB e uscite video.

L'idea è quella di sfruttare le capacità di calcolo eterogeneo di queste soluzioni, ovvero compiere calcoli sia grazie ai core x86 che mediante le unità grafiche integrate. Da tempo le schede video stanno guadagnando spazio nel settore HPC, grazie alle soluzioni dedicate Nvidia Tesla o AMD FireStream capaci di svolgere operazioni altamente parallele. Optare per delle APU potrebbe essere un compromesso accettabile tra complessità del sistema e consumi.

L'Altus A2A00 è stato appunto realizzato perciò non per raggiungere prestazioni elevate, ma per permettere ad AMD e Penguin di capire come usare questo tipo di soluzioni in ambito HPC, realizzare soluzioni efficienti e software in grado di avvantaggiarsi delle risorse hardware.

Le unità grafiche delle APU possono essere sfruttate attraverso il framework di programmazione OpenCL e poiché tutto è su un unico die, programmare le APU è più semplice, i colli di bottiglia dei dati tra GPU e memoria principale non ci sono e si elimina la duplicazione dei dati. Al Sandia National Labs sono interessati alla combinazione di interconnessioni a bassa latenza che supportano RDMA (Remote Direct Memory Access), come Infiniband, e le APU.