Tesla M40 e M4, Nvidia schiaccia il piede sull'acceleratore

I datacenter devono gestire una mole sempre più grande di dati e garantire nuovi servizi. Con Tesla M40 e M4 Nvidia vuole rispondere alla richiesta di hardware più potente.

Avatar di Manolo De Agostini

a cura di Manolo De Agostini

Con YouTube, Periscope, Twitch e altri servizi gli utenti di Internet non sono più solo fruitori di contenuti, ma anche creatori in prima persona. Pensate per esempio che 10 milioni di utenti Periscope guardano 40 anni di video al giorno, oppure all'ora e mezzo di filmati visti su Twitch da ogni utente nel mondo.

La sfida per chi realizza infrastrutture (datacenter) è riuscire a gestire tutta questa mole di traffico, detta anche "data tsunami", in tempo reale offrendo agli utenti un'esperienza fluida, migliorata e se possibile condita anche da altri contenuti, come quelli pubblicitari, serviti sulla base dei gusti dell'utente.

nvidia tesla m40

Nvidia Tesla M40 - clicca per ingrandire

Si tratta di una serie di carichi di lavoro che in passato non c'erano e che contemplano la transcodifica video, l'analisi dei dati, il processing dei dati e anche il deep learning (in italiano "apprendimento approfondito", ossia il processo tramite il quale i computer usano reti neurali - strutture di dati simili alla corteccia cerebrale umana).

nvidia tesla m4

Nvidia Tesla M4 - clicca per ingrandire

Per questo gli HPC (High Performance Computer) necessitano di hardware sempre più evoluto e potente, come le nuove Tesla M40 e Tesla M4. La prima è pensata per offrire le prestazioni più elevate nell'ambito del deep learning, la seconda per avere un buon connubio tra potenza e consumi al fine di gestire quantità d'informazioni elevate.

Dal punto di vista tecnico la Tesla M40 è basta su una GPU GM200 con 3072 CUDA core, affiancati da 12 GB di memoria GDDR5, per una potenza di picco a singola precisione di 7 TFLOPs, un bandwidth di 288 GB/s e TDP di 250 watt. Caratteristiche simili alla GeForce GTX Titan X, anche se il bandwidth inferiore fa pensare a una frequenza minore per la memoria.

nvidia maxwell tesla JPG

Secondo Nvidia questa soluzione permette di accorciare di ben 8 volte il tempo di apprendimento dei sistemi di deep learning rispetto alle tradizionali CPU. La Tesla M4 monta un chip con 1024 CUDA core, 4 GB di memoria GDDR5 e un TDP tra 50 e 75 watt. Il bandwidth è pari a 88 GB/s, mentre la potenza di picco è di 2,2 TFLOPs. La scheda acceleratrice è caratterizzata da un formato a basso profilo, quindi può essere inserita in server più densamente popolati.

nvidia maxwell tesla 02 JPG

Clicca per ingrandire

Non solo di hardware è però fatto il settore HPC. Al fine di velocizzare la gestione dei dati Nvidia ha messo a punto una "hyperscale suite" composta da GPU REST Engine, GPU Accelerated FFmpeg e Image Compute Engine il tutto con importanti miglioramenti prestazionali, anche grazie al supporto per le GPU in ambienti come Apache Mesos.

GeForce GTX Titan X GeForce GTX Titan X