La rapida diffusione dell'intelligenza artificiale sta richiedendo hardware in grado di supportare carichi di lavoro specifici e ingenti. Produrre nuovi chip capaci di sfruttare le potenzialità dell'IA significa pesare notevolmente sui costi di produzione; inoltre, bisogna considerare il collo di bottiglia di von Neumann.
Per questo Dharmendra Modha, ricercatore di IBM, ha cominciato a studiare un modo per superare questo limite. Negli ultimi otto anni Modha e il suo team hanno lavorato a un nuovo chip per l'inferenza neurale chiamato NorthPole.
Estensione di TrueNorth, un chip ispirato al funzionamento del cervello umano realizzato dal ricercatore prima del 2014, NorthPole è in grado di migliorare l'efficienza dei carichi di lavoro in termini di energia, spazio e tempo di esecuzione in un modo mai visto prima d'ora, ha spiegato Modha.
Stando ai risultati dei test pubblicati dal team di ricerca, ottenuti usando la rete neurale convoluzionale a 50 livelli ResNet-50 come benchmark, NorthPole è 25 volte più efficiente in termini di consumi energetici delle tradizionali GPU 12-nm e delle CPU 14-nm (calcolato come numero di frame interpretati per joule).
Il chip ha superato le architetture tradizionali anche in termini di latenza e di spazio necessario per la computazione (frame interpretati al secondo per miliardi di transistor). Secondo Modha, su ResNet-50 NorthPole supera le performance di tutte le principali architetture in uso, comprese le GPU che utilizzano un processo a 4nm.
Il chip supera il collo di bottiglia di von Neumann grazie al fatto che tutta la memoria si trova sul dispositivo stesso. NorthPole è stato realizzato con nodi di processo a 12-nm e contiene 22 miliardi di transistor in 800 millimetri quadri di spazio. Ha 256 core e può eseguire 2048 operazioni per core per ciclo a precisione 8 bit, con la possibilità di raddoppiare e quadruplicare il numero di operazioni utilizzando le precisioni 4-bit e 2-bit.
"Dal punto di vista architetturale, NorthPole sfuma il confine tra calcolo e memoria" ha dichiarato Modha. "A livello di singoli core, NorthPole appare come un memory-near-compute e dall'esterno, a livello di input-output, appare come una active memory".
Le applicazioni di NorthPole
Il nuovo chip può essere usato per diversi casi d'uso emergenti relativi all'IA. Durante i test, il team di ricerca si è concentrato per lo più in task relativi alla computer vision, come la classificazione di video, la segmentazione di immagini e il riconoscimento degli oggetti.
Inoltre, NorthPole è stato testato per attività di Natural Language Processing (usando il modello BERT di Google) e di Speech Recognition (col modello DeepSpeech2).
Viste le sue capacità, il chip può essere usato nei veicoli a guida autonoma, nella robotica, negli assistenti digitali, per lo spatial computing e in generale per tutte quelle applicazioni edge che richiedono l'elaborazione in tempo reale di grandi quantità di dati.
Tra i vari casi d'uso c'è anche il monitoraggio via satellite dell'agricoltura delle popolazioni di animali selvatici e l'individuazione di cyber minacce per migliorare la sicurezza dei business.
Le possibilità di NorthPole sono molto vaste e i risultati condivisi dal team di Modha sono solo il primo passo verso un futuro di chip più performanti ed efficienti. Dopo otto anni di ricerca tenuta ben nascosta, i ricercatori sono riusciti a produrre un chip che promette di rivoluzione l'esecuzione dei carichi di IA. Ora non ci resta che aspettare di vedere cosa NorthPole sarà davvero in grado di fare.