All’Hot Chips 2023 Intel ha svelato la sua prima interconnessione mesh-to-mesh fotonica, un passo importante verso l’interconnessione ottica chip-to-chip. Il chip usato da Intel per dimostrare l’interconnessione è dotato di 8 core e 528 thread, presentando quindi un’architettura unica, che offre 66 thread per core e e offre un throughput fino a 1TB/s.

Se state già pensando a consumi fuori da ogni logica, vi fermiamo subito: l’assorbimento si ferma a soli 75 watt, il 60% dei quali viene assorbito dalle interconnessioni ottiche. In futuro, questo design potrebbe permettere di creare sistemi con due milioni di core tutti direttamente connessi tra loro, con una latenza inferiore ai 400ns.

Intel ha chiamato il chip PUMA, acronimo di Programmable Unified Memory Architecture. PUMA è parte del programma DARPA HIVE, che si occupa di migliorare le prestazioni nell’analisi su scala petabyte per arrivare a migliorare di 1000 volte le prestazioni per watt nei carichi di lavoro iper-sparsi.

PUMA si basa su un’architettura RISC, che offre buone prestazioni in questi carichi di lavoro e offre performance 8 volte migliore in single-thread rispetto a un’architettura x86. Il chip è inoltre prodotto con i 7nm di TSMC.

Durante lo sviluppo, Intel ha dovuto creare qualcosa capace di sostenere l’enorme stress a cui erano sottoposti il memory subsystem, la branch prediction e diversi altri elementi; le sfide sono state superate grazie all’implementazione di 66 thread hardware per core, cache L1 molto ampia (sia per le istruzioni che per i dati) e 4MB di SRAM per core.

Il chip è abbinato a 32GB di RAM DDR5-4000 e ha 32 porte ottiche I/O che operano ognuna a 32GB/s, così da arrivare a quel 1TB/s citato in apertura. La motherboard che lo ospita ha 8 socket, quindi il sistema può arrivare ad avere un throughput ottico fino a 16 TB/s.

Il die misura 316 mm² e ospita anche quattro chiplet (due sopra e due sotto) con I/O ottico a 8 canali, che si occupano di trasmettere i segnali interni alle interconnessioni ottiche esterne. Questi elementi sono connessi sfruttando il packaging EMIB di Intel e sfruttano il protocollo AIB.

Per gestire l’enorme numero di dati generati dai 528 thread, Intel ha creato un mesh 2D on-die con 16 router che si occupano di distribuire i dati tra i core, i controller di memoria e le interconnessioni ottiche.

Il risultato finale è senza dubbio sorprendente, specialmente se consideriamo che Intel ha dichiarato che le prestazioni scalano in maniera quasi perfettamente lineare fino a 1000 core. L’interconnessione ottica sembra davvero essere il futuro e se queste sono le premesse, non vediamo l’ora che arrivi nei prodotti che usiamo tutti i giorni, anche se ci vorrà ancora parecchio tempo.