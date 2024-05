Arm, la compagnia che progetta la maggior parte dei core CPU utilizzati negli smartphone Android ma non solo, ha appena annunciato importanti novità. Qualcomm sta passando ai suoi core Oryon per lo Snapdragon 8 Gen 4, dunque un numero significativo di smartphone top di gamma che verranno rilasciati il prossimo anno non sarà mosso da core progettati direttamente da Arm. Tuttavia, MediaTek continuerà a utilizzare i core Arm, e Qualcomm potrebbe rilasciare SoC non di punta che combinano questi core in futuro.

Tra le novità principali di Arm ci sono il core di punta Cortex-X925, il core ad alte prestazioni Cortex-A725 e il core ad alta efficienza Cortex-A520 Refresh. Questi core sono conformi all'architettura Arm v9.2 e costituiscono la base del CSS (Compute SubSystems) per Client, precedentemente noto come Total Compute Solutions. La compagnia ha anche presentato una nuova DynamIQ Shared Unit (DSU) e una GPU migliorata, la Immortalis G925.

Il Cortex-X925 rappresenta un significativo balzo in avanti per la serie X di Arm, che si distingue dalla serie A per la sua filosofia di consentire un maggiore consumo di energia per ottenere prestazioni superiori. Tipicamente, i produttori di chipset includono solo uno o due di questi core, data la loro elevata domanda energetica.

Quest'anno, Arm ha migliorato notevolmente sia le prestazioni AI che l'IPC (Instructions Per Cycle). La frequenza target del X925 è di 3,6GHz o superiore, con Arm che lo definisce una piattaforma scalabile per "la prossima generazione di PC AI". Il nuovo core promette un incremento medio del 30% nelle prestazioni del cluster CPU rispetto alla generazione precedente, migliorando anche l'efficienza energetica.

Le innovazioni del Cortex-X925 sono il risultato di un miglioramento architetturale su vari fronti:

Miglioramenti del front-end: il "branch predictor" prevede il doppio degli stati futuri rispetto al passato, migliorando significativamente la precisione. La larghezza di banda per il pre-fetching delle istruzioni è raddoppiata.

il "branch predictor" prevede il doppio degli stati futuri rispetto al passato, migliorando significativamente la precisione. La larghezza di banda per il pre-fetching delle istruzioni è raddoppiata. Ottimizzazione di decode e dispatch: come CPU "10-widw", raggiunge un'alta efficienza eliminando numerosi vincoli di elaborazione. La larghezza di banda vettoriale è aumentata da 4x128 bit per ciclo a 6x128 bit per ciclo, e le pipeline ALU intere sono state espanse.

come CPU "10-widw", raggiunge un'alta efficienza eliminando numerosi vincoli di elaborazione. La larghezza di banda vettoriale è aumentata da 4x128 bit per ciclo a 6x128 bit per ciclo, e le pipeline ALU intere sono state espanse. Miglioramenti ALU: grazie ai miglioramenti specifici dei nodi di processo, l'ALU può eseguire operazioni in uno e due cicli, principalmente per compiti AI.

grazie ai miglioramenti specifici dei nodi di processo, l'ALU può eseguire operazioni in uno e due cicli, principalmente per compiti AI. Miglioramenti del back-end: piccoli miglioramenti includono l'aumento delle pipeline di carico da tre a quattro e l'ottimizzazione dell'elaborazione out-of-order.

Questi miglioramenti rendono il Cortex-X925 il core Cortex-X più potente mai realizzato, stabilendo un nuovo standard di prestazioni.

Il Cortex-A725, al contrario, mira a bilanciare consumo energetico e prestazioni, concentrandosi su giochi e carichi di lavoro AI. Rispetto all'A715 dell'anno scorso, l'A725 promette un'efficienza del 35% superiore, offrendo più prestazioni allo stesso livello di potenza.

Immagine 1 di 2

Immagine 2 di 2

La maggior parte dei carichi di lavoro AI viene ancora eseguita sulla CPU, e l'A725 è ottimizzato per questi compiti. Le principali migliorie includono:

Miglioramenti della struttura dei registri

Aumento del re-order buffer

Espansione delle code di istruzioni

Nuova configurazione cache L2 da 1MB

Questi miglioramenti permettono all'A725 di offrire prestazioni significativamente superiori a livelli di potenza inferiori, rendendolo ideale per la maggior parte dei compiti computazionali nei dispositivi moderni.

Il Cortex-A520 Refresh introduce miglioramenti minori ma significativi, focalizzati sulla riduzione del consumo energetico. La serie A520 tende a subire aggiornamenti incrementali, incorporando due anni di innovazione in ogni ciclo di refresh. Arm assicura che qualsiasi innovazione significativa sarà introdotta anche fuori dal normale ciclo di aggiornamento.

La nuova DSU (DynamIQ Shared Unit) integra più core con un sistema di memoria cache L3, logica di controllo e interfacce esterne per formare un cluster multicore. La DSU-120, basata sulla TCS23 dell'anno scorso, introduce la modalità L3 Quick Nap.

L3 Quick Nap è una modalità di risparmio energetico sofisticata che funziona in modo indipendente, senza richiedere interventi dai produttori di chipset. Garantisce che la cache L3 entri in uno stato di basso consumo quando non è in uso e si riattivi automaticamente quando necessario. Questa transizione minimizza il consumo energetico mantenendo alte prestazioni. La latenza di riattivazione è così bassa da essere effettivamente nascosta all'interno delle fasi della pipeline del processore, assicurando nessun impatto sulle prestazioni.

Il focus di Arm sui "PC AI" suggerisce potenziali applicazioni in futuri laptop, sfruttando i significativi miglioramenti rispetto ai core precedenti. MediaTek probabilmente continuerà a utilizzare core Arm pronti all'uuso, e alcuni chip di fascia inferiore di Qualcomm potrebbero incorporare queste novità.