Articoli e news    Prezzi

UPU, la rivoluzionaria CPU cinese per dispositivi Android

06:49 - 16 gennaio 2012 di Manolo De Agostini

L'approccio UPU, Unified Processor Unit, della cinese ICube porta una ventata d'aria fresca nel mondo delle architettura dei chip. L'obiettivo è realizzare un progetto in cui un'unità sia in grado di gestire istruzioni generiche e grafiche senza problemi, abbattendo le barriere tra i due concetti.

Dopo l'approccio APU, ecco spuntare quello UPU (Unified Processor Unit). Prende il nome di Harmony Unified Processing Architecture la nuova soluzione della cinese ICube, che al pari del progetto Loongson (o Godson), punta a dare al paese asiatico un'alternativa fatta in casa per realizzare i propri telefoni e dispositivi Android, piuttosto che dover dipendere da azienda straniere.

ICube è gestita da due veterani dell'industria, Fred Chow e Simon Moy, che in passato rispettivamente hanno lavorato in Pathscale e Nvidia, ed entrambi sono passati per SGI. Sebbene le informazioni sul progetto siano tuttora limitate, ExtremeTech e Vr-Zone hanno pubblicato interessanti disamine sulle caratteristiche di questa architettura.

La Harmony Unified Processing Architecture consiste di core RISC paralleli chiamati MVP (Multi-Thread Virtual Pipeline), un set di istruzioni indipendente, un compilatore ottimizzato e una soluzione per il bilanciamento dinamico del carico chiamata "Agile Switch".

Il chip IC1, prima interazione del progetto, è descritto come "parallel computing stream processor core" dotato di sia di SMP (Symmetric Multi-Processing) che di SMT (Simultaneous Multi-Threading). 

Ogni core RISC (due nella prima incarnazione) è dotato di tecnologia Simultaneous Multi-Threading 4-way, cioè è in grado di gestire fino a quattro thread. Grazie all'approccio UPU, le risorse di calcolo, lo spazio di memoria e il registro dei dati è condiviso all'interno del chip, cioè non c'è una suddivisione tra carico di lavoro CPU e GPU. 

In poche parole è come se AMD o Intel realizzassero un chip con unità in grado di gestire senza distinzioni dati x86 e grafici, ad elevata efficienza. Intel aveva pensato a qualcosa di simile con il progetto Larrabee, poi confluito parzialmente nel coprocessore x86 Knights Corner, ma non ha portato avanti lo sviluppo a causa di innumerevoli problemi.

Oggi i chip con grafica integrata delle due aziende hanno unità ben distinte, con la GPU in grado - all'occorrenza - di essere usata anche per determinati calcoli generici. In tal caso si parla di calcolo eterogeneo.

Per quanto concerne l'architettura Harmony e l'approccio UPU, si parla invece di calcolo omogeneo, dove i thread di CPU e GPU condividono le stesse risorse. Trattandosi della prima versione (di cui non è chiara le tempistica del debutto), il processore non permette calcoli in virgola mobile a doppia precisione o istruzioni vettoriali SIMD come le AVX.

Da rilevare che il primo chip, IC1, sarà realizzato con processo produttivo a 65 nanometri e avrà un die di solo 2,7 millimetri quadrati. "Questo significa che, su una CPU standard con un die di 200 mm quadrati a 32 nanometri, potreste integrare oltre 100 di questi core, più la logica d'interconnessione e una cache condivisa di diversi megabyte, tutto insieme", scrive Vr-Zone. Chi pensa che in Cina siano solo bravi a produrre su commissione e a falsificare borsette, farebbe meglio a ricredersi. La tigre asiatica sta affilando gli artigli.

Condividi:   

Commenti

Aggiungi un tuo commento
1/3 avanti    
Dirty_Punk 16/01/2012 07:49
 
molto interessante, ma un unico dubbio:
nella prima tabella come power mettono 1200mW, nella seconda Operating power 600mW. Si riferiscono uno al massimo valore tollerabile e uno a quello di funzionamento? Perchè essendo che in entrambe le tabelle lavorano a 600mhz avere il doppio del consumo da una all'altra è strano no?
lucusta 16/01/2012 07:57
 
concetto espresso gia' negli anni 2000 da Transmeta su crusoe/efficeon, anzi, almeno su questi si aveva la possibilita' di utilizzare un transcode software, il Code Morphing Software, e non hardware, che "impala" la transcodifica esclusivamente da un linguaggio ad un'altro, ne piu' ne meno come fanno le moderne X86 che ricodificano per le loro architetture RISC.
il concetto e' lo stesso proprio per via della transcodifica/ricompilazione "on fly"; qui e' HW li' era SW.
che siano calcoli general porpouse o vettoriali, dipende dall'architettura, ma visto che le VLIW gia' sono implementate nelle schede video...
StigHelmer 16/01/2012 08:22
 
+21 
Devo aver dimenticato il mio prototipo al ristorante cinese
marcybest 16/01/2012 08:27
 
+1 
Aspetto di vedere qualche prova sul campo... Perchè se ci si basa sulle slide non si và molto distante. Detto questo il prodotto è davvero interessante fin già dalla prima relase. Chi come me non gioca o quant'altro su smartphone può essere un'ottima alternativa alla coppia cpu+gpu, che credo, in termini prestazionali rimarrà al comando ( felice comunque di essere smentito )
noce 16/01/2012 09:10
 
+12 
La bontà dell'architettura si vede soprattutto dal fatto che surclassa arm in efficienza pur essendo prodotto con un vecchio processo produttivo.
JOHNNYMETA 16/01/2012 09:52
 
+1 
"Da rilevare che il primo chip, IC1, sarà realizzato con processo produttivo a 65 nanometri e avrà un die di solo 2,7 millimetri quadrati."

Sbagliato il die è di 27mmq e l'area di memoria di 5,6mmq.

Meraviglioso CHIP, veramente fantascientifico!!!
Meravigliosa architettura RISC che fa mangiare la polvere a tutte le inefficienze accumulate in 40 anni dalle architetture CISC di Intel e AMD. Ma è ancora più impressionante il colossale divario di efficienza rispetto alla stessa architettura RISC di ARM.
demon77 16/01/2012 09:55
 
+1 
Direi che si può dare un giudizio solo vedendolo in funzione e facendo dei bench..
Sulla carta sembra bellissimo, quale è il rovescio della medaglia?
Soul91 16/01/2012 10:07
 
+25 
Plima vedele poi complale
said1 16/01/2012 10:09
 
+1 

 Originariamente inviata da JOHNNYMETA

Ma è ancora più impressionante il colossale divario di efficienza rispetto alla stessa architettura RISC di ARM.



Si, proprio colossale:
4.3 DMIPS/MHz contro i 5 di ARM... poi hanno pure sbagliato i conti in tabella :-D
supertigrotto 16/01/2012 10:18
 
+3 
Per fortuna fino all'altro giorno consideravamo i cinesi dei morti di fame,sono gran lavoratori,determinati,intelligenti,intraprendenti,amano il loro paese,gli stessi imprenditori investono non solo per soldi ma per rendere grande la loro nazione (parlate con qualsiasi cinese e vedrete quanto nazionalista è).
Me la aspettavo una mossa del genere dopo godson,hanno molte menti e università preparate e tanta voglia di emergere.
Un giorno,quando ci sarà vera democrazia in cina,sarà un paese di riferimento,sia a livello tecnologico,sia di modo di vivere....
1/3 avanti    
Accedi o  registrati.
Nome utente:
Password:
Segnala TomsHW

Correlazioni