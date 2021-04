NVIDIA ha introdotto sul mercato la scheda grafica A100 lo scorso anno, realizzata per offrire prestazioni all’avanguardia in ambito data center e supercomputer, ma il prodotto è troppo potente e costoso per carichi di lavoro meno impegnativi. Così, in occasione della sua conferenza stampa alla GTC, l’azienda ha presentato due nuovi modelli: A30, per i server di analisi e intelligenza artificiale, e A10, per carichi di lavoro misti di elaborazione e grafica.

La scheda grafica A30 rappresenta la vera sorella minore di A100 e si basa sulla stessa architettura Ampere orientata al calcolo. Infatti, supporta le stesse funzionalità, un’ampia gamma di formati per AI e carichi di lavoro HPC (FP64, FP64TF, FP32, TF32, bfloat16, FP16, INT8, INT4) e persino operazioni GPU multiistanza (MIG) con istanze da 6GB . Dal punto di vista delle prestazioni, A30 offre poco più del 50% delle performance di A100, quindi stiamo parlando di 10,3TFLOPS FP32, 5,2 TFLOPS FP64 e 165TFLOPS FP16/bfloat16.

Per quanto riguarda la memoria, l’unità è dotata di 24GB di RAM con una larghezza di banda di 933GB/s. Il sottosistema sembra essere privo del supporto ECC, il che potrebbe costituire un limite per coloro che hanno bisogno di lavorare con set di dati di grandi dimensioni, i quali dovrebbero passare alla più costosa e potente A100. NVIDIA A30 sarà disponibile nel form factor FHFL (full-height, full length) a doppio slot, con un’interfaccia PCIe 4.0 x16 e un TDP di 165W, maggiore rispetto ai 250W della A100. Inoltre, A30 supporta un NVLink a 200GB/s (una consistenza diminuzione a confronto dei 600GB/s della A100).

Invece, A10 è un prodotto completamente diverso che può essere utilizzato per grafica, inferenza AI e codifica/decodifica video. L’unità supporta i formati FP32, TF32, blfoat16, FP16, INT8 e INT4 per grafica e AI, ma non quello FP64 richiesto per HPC. Si tratta di una scheda grafica FHFL a slot singolo con un’interfaccia PCIe 4.0 x16 che verrà installata nei server che eseguono il software NVIDIA RTX Virtual Workstation (vWS) ed equipaggiano le workstation che richiedono funzionalità sia AI che grafiche in remoto.

In larga misura, A10 dovrebbe essere una valida proposta per artisti, designer, ingegneri e scienziati (che non hanno bisogno di FP64). NVIDIA A10 sembra essere basata sulla GPU GA102 (o un suo derivato), ma poiché supporta INT8 e INT4, non possiamo essere sicuri al 100% che questo sia fisicamente lo stesso processore presente sulle schede GeForce RTX 3080/3090 e RTX A6000. Infine, le prestazioni dell’A10 (31,2 FP32 TFLOPS, 125 FP16 TFLOPS) sono simili a quelle della GeForce RTX 3080 e a bordo sono presenti 24GB di memoria GDDR6 in grado di offrire una larghezza di banda di 600 GB/s.

Per quanto riguarda la disponibilità, NVIDIA si aspetta che i suoi partner inizino a commercializzare macchine equipaggiate con le sue schede A30 e A10 entro fine anno.