CPU

Sunny Cove e una nuova roadmap, Intel svela il futuro dei suoi microprocessori

Intel ha presentato una nuova roadmap in fatto di architetture x86 e annunciato la microarchitettura Sunny Cove nel corso dell’Architecture Day che si è tenuto a Santa Clara nelle scorse ore. Come noto, il dominio dell’azienda sul mercato dei chip si è sempre basato sulla duplice leadership sul fronte delle architetture e dei processi produttivi.

In poche parole, con il progredire delle architetture si passava a processi produttivi più avanzati, capaci di migliorare ulteriormente il quadro generale, soprattutto i consumi. Quell’approccio ha iniziato a prestare il fianco quando Intel ha incontrato evidenti problemi di messa a punto del suo processo produttivo a 10 nanometri.

Anziché portare sul mercato nuove architetture, l’azienda è stata costretta ad affidarsi ai 14 nanometri per ben quattro anni di fila, rifinendo costantemente il processo produttivo tramite versioni indicate da un “+”. Ogni nuova versione dei 14 nanometri ha permesso a Intel di aumentare le frequenze e così le prestazioni, passando da 4,2 a 5,1 GHz. Questi miglioramenti hanno garantito fino al 70% di prestazioni in più dal debutto dei 14 nanometri nel 2014 a oggi, ma l’assenza di una nuova microarchitettura, che solitamente migliora il throughput IPC (istruzioni per ciclo di clock) del processore, ha rallentato i progressi.

Dopo aver imparato una dura lezione, resa ancora più difficile da digerire dal ritorno alla competitività di AMD, Intel ha iniziato a progettare nuove architetture che possano essere realizzate con più processi produttivi. Questo le consentirà comunque di offrire soluzioni più avanzate anche se incontrerà ostacoli nel cammino volto a un costante rimpicciolimento dei transistor.

Sunny Cove è la prima microarchitettura che può essere usata su diversi processi produttivi, e anche se Intel ha dichiarato che il nuovo core debutterà con i 10 nanometri, non è certo che arriverà con i chip Ice Lake. In linea con le nuove specifiche di progettazione, Intel ci ha anche detto che selezionerà differenti processi produttivi per prodotti diversi in base alle necessità del segmento. È un approccio simili a quello dei produttori di terze parti TSMC e Globalfoundries, e significa che Intel può scegliere di usare Sunny Cove anche per processori a 14 nanometri.

Intel, la roadmap dei core x86

Intel di solito usa gli stessi nomi sia per le architetture che per i processori. Perciò i processori Skylake sono basati su architettura Skylake, i processori Kaby Lake su architettura Kaby Lake e così via. Quel vecchio paradigma è però destinato a cambiare ora che Intel ha scelto di disaccoppiare le proprie architetture dai prodotti finali. Di conseguenza ecco debuttare una nuova roadmap specifica per i core x86.

Intel ha presentato la nuova roadmap sia per la gamma Core che quella Atom. Come sempre la serie Core comprende chip ad alte prestazioni, mentre gli Atom servono il segmento a basso consumo. Sunny Cove debutterà nel 2019, offrendo maggiori prestazioni nei compiti single-thread, un nuovo instruction set architecture (ISA) e un progetto pensato per la scalabilità. Willow Cove seguirà con una migliorata gerarchia della cache, funzionalità di sicurezza e ottimizzazioni ai transistor. La microarchitettura Golden Cove debutterà nel 2021 garantendo ancora più prestazioni single-thread, prestazioni con carichi di intelligenza artificiale, miglioramenti legati al networking e nuove funzionalità di sicurezza. La gamma Atom riceverà miglioramenti a ritmi meno serrati, con Tremont che debutterà nel 2019 e Gracemont nel 2021. ‘Next’ Mont arriverà prima del 2023.

Intel ha in serbo miglioramenti prestazionali generali, ma vuole compiere progressi anche in quei casi d’uso specializzati come IA, crittografia e carichi di compressione e decompressione.

Ricordando Skylake

Prima di approfondire la nuova architettura Sunny Cove, Intel ci ha ricordato le fondamenta dell’architettura Skylake, alla base dei processori Skylake, Kaby Lake, Coffee Lake e Cascade Lake che ci hanno accompagnato negli ultimi anni – e in parte ci accompagneranno ancora. Il design (a sinistra) processa operazioni tramite due reservation stations (RS), gestire sette operazioni simultaneamente e spingerle verso integer (INT), vector (VEC), store data e address generation units (AGU).

Migliorare ogni livello della pipeline

La nuova microarchitettura Sunny Cove vede miglioramenti a ogni livello della pipeline. I passi avanti chiave al front end includono buffer più ampi per reorder, load e store, insieme a reservation stations più capienti. Ciò consente al processore di esaminare più in profondità l’insieme delle istruzioni in entrata per trovare operazioni indipendenti tra loro ma che possono essere eseguite simultaneamente. Le operazioni sono poi eseguite in parallelo per migliorare l’IPC.

Intel ha aumentato la cache dati L1 da 32 kb a 42 kb (+50%). Anche la cache L2 è più grande, ma la capacità è legata a ogni specifico tipo di prodotto – se il chip è destinato ai desktop oppure ai server, insomma. Intel ha inoltre espanso la micro-op cache (uop) e il translation lookaside buffer (TLB) di secondo livello.

Maggiore parallelismo

Un aspetto chiave per migliorare le prestazioni è aumentare il parallelismo. Ciò inizia con il buffer più profondo e le reservation station già descritte, ma richiede anche più execution unit per elaborare le operazioni.

Intel passa da un’allocazione four-wide a una five-wide per consentire alla porzione in-order della pipeline (front end) di alimentare la porzione out-of-order (back end) più rapidamente. Intel ha inoltre aumentato il numero di execution unit per gestire 10 operazioni per ciclo – dalle otto di Skylake. L’unità Store Data può ora processare due operazioni store data per ogni ciclo (in passato solo una). L’address generation unit (AGU) può ora inoltre gestire due load e due store per ogni ciclo. Questi miglioramenti sono necessari per pareggiare il bandwidth maggiore dalla cache L1 dati più capiente, che ora fa due letture e altrettante scritture ogni ciclo. Intel ha inoltre modificato il progetto dei sotto blocchi nelle execution unit per permettere il rimescolamento dei dati all’interno dei registri.

Più intelligente

Intel ha spiegato che aumentare la dimensione dei buffer e il numero di execution unit richiede una gestione algoritmica intelligente per avere un bilanciamento tra le prestazioni e i consumi. Tutto questo vuol dire in soldoni una maggiore precisione nella branch prediction e la riduzione della latenza sotto carico. L’effetto netto è un “rilevante” aumento dell’IPC. Intel non ha fornito valori specifici, ma ha promesso che condividerà maggiori informazioni con l’approssimarsi del debutto sul mercato.

Specializzazione

Intel ha inoltre progettato Sunny Cove per casi d’uso specifici come crittografia, IA e carichi di compressione / decompressione. L’azienda ha centrato questi obiettivi creando nuove istruzioni e funzionalità per migliorare le prestazioni.

Capacità di memoria in espansione

Intel ha aumentato anche la quantità di memoria che il processore può indirizzare, un aspetto fondamentale dato il suo obiettivo di aumentare la capacità di memoria con le DIMM Optane DC Persistent Memory. I veloci moduli di memoria Optane forniscono fino a 512 GB di memoria indirizzabile per DIMM, il che significa che la capacità di memoria “esploderà” non appena un maggior numero di datacenter adotterà la tecnologia.

Sunny Cove passa a una struttura di paging a 5 livelli – dai quattro delle architetture precedenti. Questo aumenta lo spazio d’indirizzamento virtuale fino a 57 bit e lo spazio d’indirizzamento fisico fino a 52 bit, il che significa che supporta fino a 4 petabyte di memoria, rispetto ai 64 TB di Skylake.

Il nuovo corso di Intel e “One API”

Sunny Cove è un progetto innovativo e sembra promettente, ma come sempre non conosceremo i veri benefici se non quando testeremo i processori in laboratorio. La nuova visione di Intel di disaccoppiare il progetto delle architetture dai processi produttivi è un passo avanti concreto che migliorerà la competitività dell’azienda in futuro. Di certo Intel non può permettersi un altro periodo di stagnazione come quello che abbiamo visto – e vediamo tuttora – nel passaggio dai 14 ai 10 nanometri.

I produttori di terze parti si sono dimostrati concorrenti formidabili per Intel. TSMC sta producendo a 7 nanometri, con il risultato che AMD, Apple, Qualcomm e Nvidia hanno o avranno presto chip a 7 nanometri. Queste aziende lavorano insieme a TSMC per portare i loro progetti sul mercato, il che significa che Intel non è in competizione con una sola azienda, ma con diversi colossi nella progettazione di chip.

Intel ha intenzione di sconfiggere i suoi rivali sfruttando la sua ampia gamma di prodotti, ma per farlo ha bisogno anche di una parte software molto robusta. Intel sta lavorando su “One API”, progettata per semplificare la programmazione per acceleratori di AI, GPU, CPU e FPGA. Il software segue la filosofia del “nessun transistor deve essere lasciato indietro” e, dato l’obiettivo, è fondamentale.

Il nuovo software metterà a disposizione librerie unificate che consentiranno alle applicazioni di spostarsi senza problemi tra i diversi tipi di hardware di casa Intel. In caso di successo, potrebbe essere un fattore chiave di differenziazione che altre aziende non saranno in grado di eguagliare, almeno non in maniera così vasta.

Ice Lake

Durante l’incontro Intel ha mostrato un chip Ice Lake per datacenter prodotto a 10 nanometri. Purtroppo l’azienda non ha voluto condividere alcun dettaglio.