Nvidia Project Echelon, PC Exascale che farà exaflop

La DARPA sponsorizza una gara per la realizzazione di un computer exascale entro il 2018. Nvidia sfida Intel e altri partecipanti. Ecco i piani dell'azienda per il progetto Echelon

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Nvidia sta lavorando con il Dipartimento della Difesa statunitense a un Computer Exascale chiamato Echelon, il cui debutto è previsto per il 2018. Un computer di questo genere avrà una potenza ben oltre i petaflop, si parla infatti exaflop. La casa di Santa Clara, all'interno di un programma chiamato "Ubiquitous High Performance Computing Program", sta affrontando la concorrenza di altri progetti intavolati da Intel, MIT e Sandia National Labs.

Per arrivare al prodotto "finito" sarà necessario procedere per piccoli passi. Si pensa infatti di realizzare il prototipo - entro il 2014 - di un sistema di classe petaflop all'interno di un rack da 57 kilowatt. Da qui si lavorerà su ottimizzazioni che dovrebbero consentire di arrivare al sistema exascale in quattro anni.

Per questo progetto Nvidia ha intenzione di riusare tecnologie già alla base dei suoi prodotti, da Tegra ai chip Tesla, per ricercare un elevato rapporto prestazioni per watt. Secondo Nvidia Echelon si avvarrà di 256 MB di memoria SRAM, che consentiranno di ridurre i tempi di latenza. La SRAM potrà essere configurata dinamicamente per migliorare ulteriormente l'efficienza energetica e il throughput con applicazioni specifiche. L'obiettivo di Nvidia è quello di "avvicinare i supporti per i dati agli elementi di calcolo - i 256 MB possono essere suddivisi in sei livelli di cache - riducendo così lo spostamento dei dati e contenendo i consumi.

A oggi il progetto di Nvidia, per ora su carta e messo in pratica solo con delle simulazioni, ha portato a ridurre i requisiti energetici con operazioni in virgola mobile dai 200 picojoule dei prodotti basati su architettura Fermi a 10 picojoule.

Nell'architettura concepita da Nvidia abbiamo un processore grafico con 1024 core. Questi sono possibili grazie a 128 streaming multiprocessor, ognuno formato da otto core in virgola mobile a 64 bit e capace di eseguire quattro operazioni in virgola mobile a doppia precisione per ciclo di clock. Un chip con queste caratteristiche dovrebbe avere prestazioni equivalenti a 10 teraflop. Secondo Dally in futuro potremo avere dispositivi tascabili con appena otto core in grado di gestire 78 megaflops con calcoli a doppia precisioni.

Il chip pensato per il progetto Echelon ha il doppio dei core dell'attuale GF110 (GeForce GTX 580 e GF110: GTX 480 è solo un ricordo). I core dell'attuale GPU eseguono inoltre solo un'operazione per ciclo di clock, contro le quattro della nuova soluzione.

Oltre allo sforzo progettistico, il problema riguarda anche la programmazione. "Assisteremo a un sostanziale cambiamento nei modelli di programmazione. Nel calcolo ad alte prestazioni siamo passati dal Fortran vettorizzato all'MPI (Message Passing Interface) e ore abbiamo bisogno di un nuovo modello di programmazione per il prossimo decennio. Pensiamo potrebbe essere un'evoluzione di CUDA, ma ci sono approcci simili come OpenCL, OpenMP e DirectCompute, oppure un nuovo tipo di linguaggio", ha dichiarato Bill Dally, Chief Scientist di Nvidia.