Nvidia Pascal: i punti chiave dell'architettura che sostituirà Maxwell

Memoria 3D, calcoli mixed precision e NVLink sono i tre cardini della futura architettura Pascal di Nvidia. Ecco di cosa si tratta e quali vantaggi offriranno a ricercatori, sviluppatori e consumatori finali.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Jen-Hsun Huang, amministratore delegato di Nvidia, ha inaugurato la GPU Technology Conference 2015, l'evento che l'azienda statunitense tiene annualmente per il fare il punto sulle innovazioni introdotte, presentarle agli sviluppatori, ricercatori, appassionati e dare qualche dettaglio sulle novità future.

nvidia pascal gtc 2015

L'occasione (quattro mila i presenti) è stata propizia per offrire maggiori informazioni sull'architettura GPGPU Pascal, che seguirà nel corso del 2016 l'attuale architettura Maxwell. Secondo il boss di Nvidia le GPU Pascal accelereranno le applicazioni di deep learning fino a 10 volte rispetto agli attuali processori grafici.

pascal nvidia roadmap 05

Pascal, prestazioni fino a 10 volte maggiori di Maxwell - clicca per ingrandire

Con deep learning (in italiano "apprendimento approfondito") s'intende il processo attraverso il quale i computer usano reti neurali (strutture di dati simili alla corteccia cerebrale umana) per imparare da soli a fare determinate azioni. Il deep learning è stato al centro di tutta la conferenza dell'amministratore delegato e sarà certamente un tema di cui si parlerà sempre di più nei prossimi anni.

pascal nvidia roadmap 01

Roadmap Nvidia - clicca per ingrandire

Le GPU Pascal saranno solo il primo tassello di un percorso che potrebbe portare a creare macchine dotate d'intelligenza artificiale evoluta, pari se non superiore a quella umana. Sono tre le caratteristiche chiave della nuova architettura: memoria di tipo 3D, calcoli a precisione mista (mixed precision) e NVLink, per il trasferimento rapido dei dati all'interno e all'esterno del chip.

pascal nvidia roadmap 04

Roadmap Nvidia - clicca per ingrandire

Andiamo con ordine. Jen-Hsun Huang ha affermato che le GPU del futuro saranno affiancate da un massimo di 32 GB di memoria 3D (impilata a strati, come un grattacielo). Si tratta di una capacità 2,7 volte maggiore di quella a bordo della GTX Titan X, la nuova scheda video con 12 GB di memoria GDDR5 di cui potete leggere la recensione.

pascal nvidia roadmap 03

Roadmap Nvidia - clicca per ingrandire

Attualmente il bandwidth di memoria ha dei limiti che riducono la velocità a cui i dati possono essere consegnati alla GPU. L'introduzione della memoria 3D fornirà un bandwidth tre volte maggiore. Più precisamente si parla di un salto da 350 GB/s a 750 GB/s e oltre. Questo permetterà agli sviluppatori di creare reti neurali ancora più ampie e accelerare il proprio lavoro.

"Pascal avrà i propri chip di memoria impilati l'uno sull'altro e collocati accanto alla GPU piuttosto che sparsi sul circuito stampato. Questo ridurrà da centimetri a millimetri la distanza che i bit devono compiere passando dalla memoria alla GPU, in un continuo viaggio avanti e indietro. Il risultato è una comunicazione drasticamente accelerata e una migliore efficienza energetica", ha spiegato l'azienda.

Con calcoli "mixed precision", Nvidia intende dire che le GPU Pascal saranno in grado di eseguire calcoli in virgola mobile FP16 a una velocità doppia rispetto ai calcoli FP32 (singola precisione). L'incremento delle prestazioni in virgola mobile avrà particolari benefici sul throughput e di riflesso nella classificazione e nella convoluzione, due attività chiave del deep learning, offrendo al tempo stesso la necessaria accuratezza.

pascal nvidia roadmap 02

Roadmap Nvidia - clicca per ingrandire

Infine Nvidia ha illustrato NVLink. Si tratta di un'interconnessione sviluppata insieme a IBM che ha l'obiettivo di permettere a GPU e CPU di condividere i dati fino a 12 volte più velocemente di quanto possano fare oggi.

In questo modo saranno eliminati i colli di bottiglia e si spianerà la strada a nuova generazione di supercomputer exascale, che saranno 50-100 volte più veloci degli attuali sistemi più potenti. NVLink permette anche di aumentare sensibilmente il numero di GPU (probabilmente fino a 64) che possono lavorare insieme sui calcoli complessi richiesti dal deep learning e da altre attività scientifiche.

GeForce GTX Titan Z GeForce GTX Titan Z
MSI GTX 980 GAMING 4G MSI GTX 980 GAMING 4G

Lo scorso anno Nvidia aveva dichiarato di aver già realizzato un modulo per ospitare le GPU basate su architettura Pascal con NVLink (nella foto). Questo nuovo modulo ha dimensioni pari a un terzo della misura delle schede PCIe standard usate oggi per le GPU. I connettori in fondo al modulo Pascal consentiranno il collegamento alla scheda madre, migliorando il design del sistema e l'integrità del segnale.

L'azienda ha anche snocciolato qualche numero di Pascal, affermando che l'architettura raggiunge prestazioni quattro volte maggiori in mixed precision rispetto a Maxwell, e offre prestazioni per watt due volte maggiori. È infine interessante notare come nella roadmap di Nvidia ritorni l'architettura Volta, sparita lo scorso anno. In principio Volta - splendido omaggio al fisico e chimico italiano che inventò la prima pila - doveva arrivare dopo Maxwell, ma Nvidia ha modificato i suoi piani introducendo Pascal e facendo slittare Volta al 2018.