La Cina sfida Nvidia: Baidu svela il chip Kunlun II

Il colosso cinese Baidu ha svelato un nuovo chip per applicazioni IA, che potrebbe competere in alcuni ambiti con Nvidia A100.

Avatar di Marco Pedrani

a cura di Marco Pedrani

Managing Editor

Kunlun Chip è un'azienda recente, nata lo scorso giugno quando, come riportato da Data Centre Dynamics, il colosso cinese dell' high tech Baidu ha deciso di scorporare il proprio business legato al design di semiconduttori e di creare una nuova sussidiaria per gestirlo. Pochi giorni fa, Kunlun Chip ha annunciato l'inizio della produzione di massa del processore Kunlun II, dedicato alle applicazioni IA.

Il nuovo chip dell'azienda cinese è basato su microarchitettura XPU di seconda generazione ed è prodotto a 7nm. Secondo quanto dichiarato dall'azienda, Kunlun II dovrebbe garantire due o tre volte le prestazioni del modello precedente, a seconda del carico di lavoro in questione.

Non si tratta ovviamente di un prodotto destinato all'utenza consumer, ma di una soluzione progettata per applicazioni cloud, edge e guida autonoma di veicoli. Per quanto riguarda le prestazioni, se teniamo conto che Kunlun K200 (il predecessore) era in grado di raggiungere 256 INT8 TOPS, 64 INT/FP16 TOPS e 16 INT/FP32 TOPS a 150W, se le dichiarazioni di Kunlun riguardo alle performance della nuova generazione fossero corrette, ci troveremmo davanti un chip in grado di offrire un throughput dai 512 ai 768 INT8 TOPS, 128-192 INT/FP16 TOPS e 32-48 INT/FP32 TOPS.

Per fare un paragone, Nvidia A100 offre 19,5 FP32 TFLOPS e 624/1248 (con matrice sparsa) INT8 TOPS. Se i numeri ipotizzati per Kunlun II dovessero risultare reali, il nuovo chip di Baidu potrebbe competere con la soluzione di Nvidia, quantomeno finché si tratta di calcoli IA.

Baidu ha iniziato a lavorare a Kunlun II già nel 2011. Inizialmente l'azienda ha cercato di ricreare la microarchitettura XPU usando degli FPGA, ma nel 2018 la società è riuscita a produrre un chip dedicato grazie a una delle fonderie di Samsung, usando probabilmente il processo produttivo 14nm LPP. Il chip è dotato di due package di memoria HBM da 8GB l'uno, in grado di offrire una banda di picco di 512GB/s.