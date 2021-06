In occasione della conferenza International Supercomputing (ISC) 2021, Intel ha parlato della sua vasta gamma di soluzioni per applicazioni di supercomputing e HPC. La grande novità sul fronte hardware è che i chip per data center Sapphire Rapids saranno dotati di memorie HBM, DDR5, PCIe 5.0 e supporto per CXL 1.1. Inoltre, Intel ha confermato che le sue GPU Ponte Vecchio saranno disponibili nel form factor OAM che consuma presumibilmente fino a 600W per package. Le GPU Ponte Vecchio arriveranno in cluster di quattro o otto GPU.

Intel ha fornito molte informazioni sui suoi chip server Sapphire Rapids Xeon, alcune intenzionalmente, altre involontariamente. Sappiamo già che i processori saranno basati sull’architettura Golden Cove e realizzati sul nodo di processo Enhanced SuperFin a 10nm. Intel ha avviato i chip per la prima volta nel giugno 2020 e verranno inseriti nelle piattaforme Eagle Stream. I chip supportano anche le Intel Advanced Matrix eXtensions (AMX) che mirano a migliorare le prestazioni nei carichi di lavoro di training e inferenza.

Ora Intel ha rivelato che i chip verranno forniti con le memorie HBM, anche se l’azienda non ha specificato quanta capacità i chip supporteranno o quali saranno esattamente i moduli utilizzati, ma sicuramente si troveranno sullo stesso package dei core CPU. Intel ha confermato che i chip saranno disponibili per tutti i suoi clienti come parte della line-up di prodotti Sapphire Rapids, anche se arriveranno sul mercato un po’ più tardi rispetto alle varianti senza HBM. La compagnia non ha ancora svelato come le memorie HBM saranno viste dal sistema operativo: se come cache L4 o RAM. Tuttavia, Intel ha rivelato che i chip possono essere utilizzati con o senza memoria principale (DDR5), il che significa che probabilmente ci saranno diverse opzioni per varie configurazioni di memoria.

L’azienda ha affermato che le HBM aiuteranno con i carichi di lavoro legati alla memoria che non sono così sensibili al numero di core, forse indicando che questi chip avranno meno core rispetto ai modelli standard. Ciò ha senso data la necessità di ospitare eventualmente le HBM sotto lo stesso dissipatore di calore. I carichi di lavoro selezionati includono fluidodinamica computazionale, previsioni climatiche e meteorologiche, training e inferenza sull’intelligenza artificiale, analisi Big Data, database e applicazioni di archiviazione. Intel non ha divulgato ulteriori dettagli, ma recenti leak indicavano che i chip saranno disponibili con un massimo di 56 core e 64GB di memoria HBM2E in un package multi-chip con interconnessioni EMIB tra i die.

Intel ha anche annunciato che i suoi chip Xe HPC, che saranno impiegati per creare le schede Ponte Vecchio da 47 tile con 100 miliardi di transistor, sono ora in fase di convalida per i sistemi multi-GPU. Inoltre, la società ha affermato che i chip saranno distribuiti nel form factor OAM (Open Accelerator Module), confermando i rumor precedenti. Il fattore di forma OAM è stato progettato per l’utilizzo nell’ecosistema OCP (Open Compute Platform) ed è costituito da un die GPU montato su un supporto che viene quindi collegato alla scheda madre tramite un connettore. Questo tipo di disposizione è simile al form factor SXM di NVIDIA.

Questi tipi di package di chip sono molto comuni nei server perché consentono di utilizzare sistemi di raffreddamento più potenti rispetto a quelli delle schede tradizionali, fornendo anche un metodo ottimizzato di instradamento dell’alimentazione al package OAM attraverso un PCB (al contrario del cablaggio PCIe). È possibile che alcuni modelli utilizzino il raffreddamento a liquido. Tuttavia, è ipotizzabile che le varianti meno potenti possano avere opzioni di raffreddamento ad aria. Intel offrirà nodi con quattro o otto package OAM installati, indicati come sottosistemi x4 o x8. Tali nodi verranno quindi integrati nei server dei suoi clienti.

Le prime GPU Ponte Vecchio appariranno nel supercomputer Aurora del Dipartimento dell’Energia degli Stati Uniti, ma il lancio di questo sistema esa-scale è stato rimandato diverse volte (sei anni e oltre), anche per colpa dei ritardi con il nodo a 7nm di Intel, col risultato dei che 16 dei tiles di Ponte Vecchio saranno prodotti da TSMC. Intel ha confermato che Aurora non utilizza i form factor x4 o x8 descritti sopra: ogni blade Aurora sarà composto da sei GPU Ponte Vecchio abbinate a due CPU Sapphire Rapids (rapporto 3:1). Ponte Vecchio sarà impiegato anche nel supercomputer SuperMUC-NG a Monaco, in Germania. Questo sistema avrà 240 nuovi nodi con Ponte Vecchio abbinato a Sapphire Rapids, ma non è chiaro se sarà usato il form factor x4 o x8.