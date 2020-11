Tramite un comunicato stampa, AMD ha annunciato oggi il nuovo acceleratore AMD Instinct MI100, la GPU HPC più veloce al mondo e la prima GPU per server x86 a superare la barriera di 10 teraflops (FP64). Supportato dalle nuove piattaforme di elaborazione accelerata di Dell, Gigabyte, HPE e Supermicro, MI100, combinato con le CPU AMD EPYC e la piattaforma open software ROCm 4.0, è progettato per promuovere nuove scoperte in vista dell’era exascale.

Basata sulla nuova architettura AMD CDNA, la GPU AMD Instinct MI100 offre fino a 11,5 TFLOPS di prestazioni FP64 di picco per HPC e prestazioni di picco FP32 fino a 46.1 TFLOPS per carichi di lavoro di intelligenza artificiale e machine learning. Con la nuova tecnologia AMD Matrix Core, MI100 offre anche un aumento di quasi sette volte delle prestazioni teoriche in virgola mobile di picco FP16 per i carichi di lavoro di training AI rispetto agli acceleratori di generazione precedente di AMD.

Le funzionalità e le caratteristiche chiave dell’acceleratore AMD Instinct MI100 includono:

Nuova architettura AMD CDNA : progettata per preparare le GPU AMD all’era exascale offrendo performance ed efficienza energetica altissime.

: progettata per preparare le GPU AMD all’era exascale offrendo performance ed efficienza energetica altissime. Prestazioni FP64 e FP32 leader per carichi di lavoro HPC : Offre prestazioni FP64 di picco pari a 11,5TFLOPS e performance FP32 di picco di 23,1TFLOPS, consentendo a scienziati e ricercatori di tutto il mondo di accelerare le scoperte in settori quali scienze, energia, finanza, università, governo, difesa e altro ancora.

: Offre prestazioni FP64 di picco pari a 11,5TFLOPS e performance FP32 di picco di 23,1TFLOPS, consentendo a scienziati e ricercatori di tutto il mondo di accelerare le scoperte in settori quali scienze, energia, finanza, università, governo, difesa e altro ancora. Nuova tecnologia Matrix Core per HPC e AI : Prestazioni potenziate per una gamma completa di operazioni con matrici di precisione singola e mista, come FP32, FP16, bFloat16, Int8 e Int4, progettate per aumentare la convergenza di HPC e AI.

: Prestazioni potenziate per una gamma completa di operazioni con matrici di precisione singola e mista, come FP32, FP16, bFloat16, Int8 e Int4, progettate per aumentare la convergenza di HPC e AI. Tecnologia AMD Infinity Fabric di seconda generazione : Instinct MI100 fornisce circa il doppio della larghezza di banda I/O di picco peer-to-peer (P2P) su PCIe 4.0 con un massimo di 340 GB/s di larghezza di banda aggregata per scheda con tre link AMD Infinity Fabric. In un server, le GPU MI100 possono essere configurate con un massimo di due hive quad GPU completamente connesse, ciascuna delle quali fornisce fino a 552GB/s di larghezza di banda di I/O P2P per una rapida condivisione dei dati.

: Instinct MI100 fornisce circa il doppio della larghezza di banda I/O di picco peer-to-peer (P2P) su PCIe 4.0 con un massimo di 340 GB/s di larghezza di banda aggregata per scheda con tre link AMD Infinity Fabric. In un server, le GPU MI100 possono essere configurate con un massimo di due hive quad GPU completamente connesse, ciascuna delle quali fornisce fino a 552GB/s di larghezza di banda di I/O P2P per una rapida condivisione dei dati. Memoria HBM2 ultraveloce : Dispone di memoria HBM2 a larghezza di banda elevata da 32GB con una frequenza di clock di 1,2GHz ed offre una larghezza di banda di 1,23TB/s per supportare grandi set di dati e aiutare a eliminare i colli di bottiglia nello spostamento dei dati dentro e fuori memoria.

: Dispone di memoria HBM2 a larghezza di banda elevata da 32GB con una frequenza di clock di 1,2GHz ed offre una larghezza di banda di 1,23TB/s per supportare grandi set di dati e aiutare a eliminare i colli di bottiglia nello spostamento dei dati dentro e fuori memoria. Supporto per la più recente interfaccia PCIe Gen 4.0: Progettato con il supporto alla tecnologia PCIe Gen 4.0 più recente che fornisce fino a 64GB/s di larghezza di banda teorica per il trasporto dei dati dalla CPU alla GPU.