IBM presenta NorthPole, un nuovo chip ottimizzato per l'IA

IBM ha presentato un nuovo prototipo di CPU pensato per migliorare le attività di inferenza dei modelli di IA e ridurre i consumi energetici.

Avatar di Marina Londei

a cura di Marina Londei

Editor

La rapida diffusione dell'intelligenza artificiale sta richiedendo hardware in grado di supportare carichi di lavoro specifici e ingenti. Produrre nuovi chip capaci di sfruttare le potenzialità dell'IA significa pesare notevolmente sui costi di produzione; inoltre, bisogna considerare il collo di bottiglia di von Neumann.

Per questo Dharmendra Modha, ricercatore di IBM, ha cominciato a studiare un modo per superare questo limite. Negli ultimi otto anni Modha e il suo team hanno lavorato a un nuovo chip per l'inferenza neurale chiamato NorthPole. 

Estensione di TrueNorth, un chip ispirato al funzionamento del cervello umano realizzato dal ricercatore prima del 2014, NorthPole è in grado di migliorare l'efficienza dei carichi di lavoro in termini di energia, spazio e tempo di esecuzione in un modo mai visto prima d'ora, ha spiegato Modha. 

Pixabay
IBM NorthPole

Stando ai risultati dei test pubblicati dal team di ricerca, ottenuti usando la rete neurale convoluzionale a 50 livelli ResNet-50 come benchmark, NorthPole è 25 volte più efficiente in termini di consumi energetici delle tradizionali GPU 12-nm e delle CPU 14-nm (calcolato come numero di frame interpretati per joule).

Il chip ha superato le architetture tradizionali anche in termini di latenza e di spazio necessario per la computazione (frame interpretati al secondo per miliardi di transistor). Secondo Modha, su ResNet-50 NorthPole supera le performance di tutte le principali architetture in uso, comprese le GPU che utilizzano un processo a 4nm.

Il chip supera il collo di bottiglia di von Neumann grazie al fatto che tutta la memoria si trova sul dispositivo stesso. NorthPole è stato realizzato con nodi di processo a 12-nm e contiene 22 miliardi di transistor in 800 millimetri quadri di spazio. Ha 256 core e può eseguire 2048 operazioni per core per ciclo a precisione 8 bit, con la possibilità di raddoppiare e quadruplicare il numero di operazioni utilizzando le precisioni 4-bit e 2-bit.

Pixabay
IBM NorthPole

"Dal punto di vista architetturale, NorthPole sfuma il confine tra calcolo e memoria" ha dichiarato Modha. "A livello di singoli core, NorthPole appare come un memory-near-compute e dall'esterno,  a livello di input-output, appare come una active memory".

Le applicazioni di NorthPole

Il nuovo chip può essere usato per diversi casi d'uso emergenti relativi all'IA. Durante i test, il team di ricerca si è concentrato per lo più in task relativi alla computer vision, come la classificazione di video, la segmentazione di immagini e il riconoscimento degli oggetti.

Inoltre, NorthPole è stato testato per attività di Natural Language Processing (usando il modello BERT di Google) e di Speech Recognition (col modello DeepSpeech2). 

Pixabay
intelligenza artificiale

Viste le sue capacità, il chip può essere usato nei veicoli a guida autonoma, nella robotica, negli assistenti digitali, per lo spatial computing e in generale per tutte quelle applicazioni edge che richiedono l'elaborazione in tempo reale di grandi quantità di dati.

Tra i vari casi d'uso c'è anche il monitoraggio via satellite dell'agricoltura delle popolazioni di animali selvatici e l'individuazione di cyber minacce per migliorare la sicurezza dei business.

Le possibilità di NorthPole sono molto vaste e i risultati condivisi dal team di Modha sono solo il primo passo verso un futuro di chip più performanti ed efficienti. Dopo otto anni di ricerca tenuta ben nascosta, i ricercatori sono riusciti a produrre un chip che promette di rivoluzione l'esecuzione dei carichi di IA. Ora non ci resta che aspettare di vedere cosa NorthPole sarà davvero in grado di fare.