Una recente patch Linux pubblicata da AMD ha rivelato che la compute GPU di nuova generazione Instinct MI200, nome in codice “Aldebaran“, utilizzerà un design multi-chip module (MCM). Ciò significa che la GPU verrà fornita con due die in un singolo package invece del singolo die a cui siamo abituati con le GPU standard. L’acceleratore è basato sull’architettura CDNA 2 e sarà utilizzato nel supercomputer Exascale Frontier che sarà completato entro quest’anno.

Nella patch si legge:

Su Aldebaran, solo il die primario recupera dati validi di alimentazione. Mostra i valori di potenza/energia come 0 sul die secondario. Inoltre, il limite di potenza non deve essere impostato attraverso il die secondario.

AMD ha registrato un brevetto chiamato “GPU Chiplet Using High-Bandwidth Crosslinks“, come fatto notare da Coelacanth-dream, quindi la compagnia sta lavorando sulla sua tecnologia multi-chip per compute GPU già da un po’ di tempo. In aggiunta, secondo la patch Linux, la tecnologia GPU MCM di AMD richiede che uno dei chiplet diventi quello primario e gestisca i rimanenti, il che aiuterebbe la GPU multi-chip ad apparire e comportarsi come un unico grande processore per il sistema host.

Realizzare una compute GPU è come creare una CPU MCM multi-core, come i processori Ryzen 5000 o Threadripper. Prima di tutto, la vicinanza dei die aumenta l’efficienza di calcolo. In secondo luogo, è più facile produrre in serie chip più piccoli utilizzando una tecnologia di processo avanzata rispetto a quelli grandi dimensioni, poiché i dispositivi più piccoli di solito presentano meno difetti, offrendo una resa più elevata.

Sebbene i sottosistemi grafici multi-chip non siano mai stati veramente popolari poiché molti carichi di lavoro in ambito grafico non sono in grado di scalare in maniera efficiente, possedere un maggior numero di compute GPU sui server permette di incrementare in maniera considerevole le prestazioni a causa della natura parallela dei workload nei data center. Ovviamente, le applicazioni devono essere progettate per sfruttare al massimo questi tipi di architetture, ma sembra che stia emergendo un ampio supporto del settore per MCM, dato che anche le GPU Xe-HP e Xe-HPC di Intel si basano su tale design. Inoltre, sembra che anche le prossime compute GPU Hopper di NVIDIA siano dotate di più die.

HPE, partner di AMD, ha confermato che il prossimo supercomputer Frontier, che sarà il più veloce al mondo offrendo prestazioni di picco di 1,5 ExaFLOP, utilizzerà CPU “Trento” (molto probabilmente una versione di Milan con cache extra e/o altri miglioramenti) e acceleratori Instinct MI200.