AMD non parlerà della sua compute GPU Instinct MI200 ancora per diverso tempo, ma le patch Linux continuano a rivelare nuove funzionalità e capacità di questi prodotti in arrivo. A quanto pare, la GPU che sarà utilizzata nel supercomputer Exascale Frontier avrà un sottosistema di memoria che supporta fino a 128GB di DRAM HBM2E.

Sappiamo già che la compute GPU Instinct MI200 di AMD, nome in codice Aldebaran, sarà basata sull‘architettura CDNA 2 e utilizza due die in un unico package usando le interconnessioni ad alte prestazioni Infinity di AMD. I colleghi di Phoronix hanno riportato che una delle ultime patch Linux di AMD per il suo driver AMD64 EDAC ha rivelato l’architettura della memoria dell’Instinct MI200. A quanto pare, ciascuno dei die Aldebaran possiede quattro controller di memoria unificati (UMC). Ogni UMC supporta otto canali e ciascuno di essi è collegato a 2GB High Bandwidth Memory di seconda generazione (HBM2).

Ricordiamo che uno stack HBM2 supporta un’interfaccia a 1024 bit, generalmente chiamata canale HBM2. Tuttavia, internamente, uno stack HBM2 è composto da due, quattro o otto dispositivi DDR DRAM con due canali a 128 bit per dispositivo su un die logico di base. Essenzialmente, uno stack HBM supporta fino a otto canali a 128 bit sulla sua interfaccia a 1024 bit.

A questo punto non è del tutto chiaro cosa intenda AMD per canale, ma sembra probabile che indichi otto canali DDR a 128 bit all’interno di stack HBM2 a 1024 bit. In sostanza, ciò significa che ciascuno degli UMC di Aldebaran può connettersi a quattro stack HBM2 su un’interfaccia di memoria a 4096 bit. Con ogni canale che indirizza 2GB di memoria, un die può indirizzare fino a 64GB di memoria, mentre due die possono funzionare con un massimo di 128GB di memoria. La larghezza di banda effettiva del sottosistema di memoria di Aldebaran è sconosciuta, ma supponendo che AMD utilizzi gli ultimi stack HBM2 da 3,6Gb/s di SK Hynix, il suo sottosistema di memoria fornirà alla GPU fino a 3,64TB/s di larghezza di banda.

Le compute GPU devono usare memorie ECC, quindi parte della larghezza di banda e della capacità viene impiegata per la correzione degli errori. A tal fine, non tutti i 128GB di memoria di Instinct MI200 saranno effettivamente disponibili per le applicazioni.