La CPU di Tegra K1: un design 4+1 Cortex-A15 aggiornato

Nvidia ci ha permesso di dare uno sguardo più approfondito al SoC Tegra K1 presso il suo quartier generale a Santa Clara. Il cambiamento più importante riguarda la GPU: addio a pixel e vertex shader programmabili per fare spazio a un'architettura unificata Kepler, derivata direttamente dalle schede GeForce.

Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

La CPU di Tegra K1: un design 4+1 Cortex-A15 aggiornato

Nvidia e Samsung usano entrambe core progettati da ARM, mentre Qualcomm e Apple realizzano i propri core usando il set d'istruzioni ARM. Tegra 4 è stato il primo approccio di Nvidia all'architettura Cortex-A15, con il quale è riuscita a spingersi fino 1.9 GHz. Con Tegra K1 l'azienda è rimasta legata all'architettura Cortex-A15, ma ha fatto alcuni miglioramenti che consentono - a detta dell'azienda - di avere fino al 40% di prestazioni in più con lo stesso livello di consumo o permettere al SoC di usare solo il 45% dell'energia a un dato livello prestazionale in SPECint2000.

I quattro core Cortex-A15 condividono una cache L2 16-way set associativa

Si tratta di dichiarazioni importanti che, sempre secondo Nvidia, derivano da tre fattori. Il primo è che gli ingegneri quest'anno hanno avuto il giusto tempo per lavorare e sebbene Tegra K1 sia ancora basato su Cortex-A15, ci sono alcune ottimizzazioni uniche del layout specifiche all'implementazione di Nvidia. Il passaggio dal processo a 28 nanometri HPL a quello HPM riduce inoltre il consumo dinamico. Infine, ARM è alla quarta revisione di Cortex-A15.

Tegra K1 è basato su r3p3 (la terza revisione), mentre Tegra 4 era basato sulla seconda, r2. Secondo la documentazione tecnica di ARM, la gran parte dei cambiamenti tra i due SoC sono relativi al clock gating regionale e a un paio di altre opzioni di risparmio energetico configurabili. Le stime pongono il miglioramento delle prestazioni/watt tra il 5 e il 10%. Il risultato è che Nvidia ha potuto spingere Tegra K1 fino a una frequenza di 2.3 GHz.

L'architettura Krait di Qualcomm alloca 512 KB di cache L2 per ogni core

La flessibilità di scegliere tra prestazioni più alte o consumi inferiori significa che Nvidia può allocare il proprio budget energetico più liberamente della generazione scorsa, scalando per esempio la CPU in favore del core grafico. Nelle applicazioni legate alla grafica, è precisamente ciò che si desidera. Con il passo avanti nel supporto delle API, gli sviluppatori possono tecnicamente realizzare titoli di fascia alta per tablet Android.