AMD Threadripper 3990X: come ho battuto 10 record di overclock - 64 core a 5.7 Ghz

Stiamo parlando del Threadripper 3990X, un mostro di processore, overclockato fino a più di 5.7 GHz.

Avatar di Allen "Splave" Golibersuch

a cura di Allen "Splave" Golibersuch

Il Threadripper 3990X da 64 core e 128 thread di AMD rappresenta il vertice della pura potenza multi-thread, ma se hai letto l'articolo sull'overclock del Threadripper 3970X (qui) puoi tranquillamente evitare questo, in quanto AMD ha semplicemente raddoppiato le performance: il 3970X moltiplicato per due è uguale al Threadripper 3990X, un fenomeno indiscusso di processore. 8 chiplet da 8 core uniti e nascosti sotto una coperta di rame rettangolare, girando al minimo in attesa della chance per avventarsi sul primo processo in multi-thread a portata di mano. Sono necessari a tutti i 128 thread di potenza dal team red? A voi la scelta.

Mentre pensate ai modi per ottenere un mutuo o a quali parti del corpo non vi servano per poter acquistare questa CPU,  vi mostrerò come ho infranto alcuni record e come mi sono fatto strada da 4.3 Ghz stock fino a 5.749 Ghz in overclock.

Arriviamo al sodo. Tutte le frequenze e i thread del mondo non ti porteranno da nessuna parte senza un sistema operativo che lavora come si deve. Ho usato Windows 10 perché l’obiettivo è un record valido, e sono limitato ad usare Windows 10 per fare ciò.

Ho passato settimane a provare differenti versioni di Windows 10, Server, Enterprise, Pro, Build 19035, 1909, 1809, 118... Il tutto alla ricerca del miglior sistema operativo per gestire la forza titanica che è il 3990X. Benchmark diversi e risultati diversi, ma Server 2019 1809 e 2012 offrono performance non parallelizzate così alte che ho battuto punteggi di raffreddamento ottenuti con azoto liquido con un semplice raffreddamento a liquido. Per darvi un’idea del processo, immaginatemi con una pessima postura, mano sul mento a testare un’infinità di installazioni diverse, registrando impostazioni, memoria disponibile e valori di prefetch. Questo è lontano anni luce dalle foto con led RGB soffusi dal fumo dell’azoto che vedete nell’articolo. Qui è dove la frase “potrebbero farlo tutti” muore. È devastante, ma alla fine della giornata, il record ne vale la pena.

Come potete vedere, tutte le prove sono valse a qualcosa. Il record del mondo per il benchmark HWBot 4K x265 è a tiro e dovrebbe essere facilmente battibile con l’azoto liquido. In questo benchmark un 3990X overcloccato e raffreddato con un chiller è quasi veloce quanto una CPU AMD Epyc da 15.000 euro che ha il doppio dei thread e dei core.

Il fattore davvero limitante nei chip Threadripper sono le temperature di Infinity Fabric. Il sistema molto spesso non si avvia a basse temperature.

Per il benchmark x265 4K, volevo vedere quanto potesse andare avanti una CPU con un carico estremo raffreddata a liquido a zero gradi. Anche a zero gradi con il Fabric a 1867MHz, ho avuto problemi ad avviare il sistema a causa delle temperature troppo basse. Ho dovuto spegnere la pompa per avviare ed entrare nel sistema operativo, in quanto impedendo al waterblock di ricevere acqua fresca il raffreddamento è meno efficace e il chip rimane più caldo. Una volta nel sistema operativo, la CPU risponde alle basse temperature proprio come ci si aspetterebbe: le ama. Facendo girare il chip a 4.5Ghz su tutti i 64 core a 1.4V, il Threadripper 3990X raggiunge i 1280 watt a zero gradi.

Con un raffreddamento dell’ambiente normale, il Fabric può stare a 1867MHz tutto il giorno senza il minimo problema. 

Giusto un ultimo aneddoto sul test prima di giocare con l’azoto liquido: questi processori sono molto contenti con il multi-threading simultaneo (SMT) spento. Possiamo alzare i clock, usare meno potenza, e i software per i benchmark sono più felici in generale senza il bisogno della compatibilità “two-nodes”. Wprime32, Wprime1024 e Cinebench R11.5 girano tutti circa il 30% più veloci con il SMT spento e i clock stanno nel range dei 4.5GHz con un normale raffreddamento custom a liquido.

È anche interessante comparare il 3970X con SMT acceso e il 3990X con SMT spento, 64 thread ognuno. Su Wprime1024, con entrambi i processori a 4.5GHz e 64 thread attivi il 3970X inizia a lavorare a regime in 17.5 secondi mentre il 3990X ci mette solo 12.5 secondi. Questo per mostrarvi che il numero dei thread non è l’unica cosa da considerare e i core fisici sono senza dubbio molto più veloci.

Questo ci permette di ragionare su informazioni che non ho ancora considerato: l’overclock della memoria sul 3990X è insignificante comparato al 3970X. Lavorare su più die sembra essere più complicato. Tre dei quattro processori 3970X che ho testato hanno facilmente mantenuto un clock della memoria a 4600-4800MHz con una latenza di 14-14-14-14-1T, ma pur facendo tutto il possibile per superare i 4400MHz con il 3990X, abbiamo fallito. È un problema? Non proprio, dato che la maggior parte delle volte cerchiamo di tenere la frequenza della memoria, il Fabric clock e l’Uclock in linea a 1:1:1, ma pensavo fosse comunque degno di nota.

Metterei il potenziale di overclocking con un sistema a liquido per un 3990X medio nel comodo range dei 4.3-4.4GHz in base alla fortuna alla "lotteria del silicio". Con un raffreddamento ad aria di fascia alta possiamo arrivare a circa 4.0-4.1GHz. Se però spendi 4000 euro per questo processore, spendi qualcosa di più e raffreddalo come si deve.

Configurazione azoto liquido:

Ho usato la ASRock TRX40 Taichi per l’overclocking, la stessa scheda usata per il 3970X. ASRock ha creato la scheda con il Threadripper da 64 core in mente, infatti ha 16 fasi da 90 Ampere. Quanta potenza può gestire il VRM? Tutta. Quel blocco di raffreddamento per i VRM non è uno scherzo.

Ho usato due alimentatori per dare alla CPU tutta la potenza necessaria. Si tratta di un paio di alimentatori Enermax Maxtytan da 1250 watt che erogano 104A sul canale +12V. Li ho collegati con un semplice adattatore per alimentatori doppi.

Le cose diventano interessanti con gli adattatori da 8 pin. Questi adattatori trasformano il cavo da 8-pin per la CPU e uno da 6-pin PCIe in un singolo connettore da 8-pin per la CPU. La miglior tecnica di bilanciamento è prendere un connettore 6-pin dal primo alimentatore e quello da 8-pin dal secondo alimentatore e collegarli al primo connettore da 8-pin della mobo, passando ovviamente per l’adattatore.

Poi ho rifatto lo stesso al contrario (invertendo alimentatore uno e due) per il secondo connettore 8-pin della scheda madre. Siccome la motherboard non è fatta per essere alimentata da due alimentatori il carico non è diviso in 50%/50%, ma dopo un paio di test questa configurazione mi ha portato a un rapporto di energia di 35%/65% fra i due. Sapendo bene che, con il 3970X, uno dei due alimentatori da solo può avere un picco di 1500 watt senza problemi, dovrei avere un margine notevole con due alimentatori nonostante lo sbilanciamento menzionato prima.

G.Skill ha disegnato la linea Neo specificamente per i sistemi AMD, supporta latenze ristrette a frequenze più basse con risultati stellari. Posso usarle a 3200 MHz con timing a 11-11-11-11-1t oppure a 4400 MHz a 14-14-14-14-1t, entrambi i settaggi a un voltaggio molto basso per un kit di memorie B-die. Ho ricevuto una marea di campioni di memorie B-die, ma questo kit ha decisamente battuto tutti gli altri.

Geekbench3 era il mio primo obiettivo come bench per l’azoto liquido. È un benchmark davvero tosto su 64 core e richiede quasi due minuti per essere completato. Il subtest più difficile (il Ray Trace) è uno degli ultimi, attorno agli 1:45. Il tasso di successo/insuccesso sul filo del rasoio è di circa il 10%. Riuscite a immaginare il dover bilanciare un carico di 1800 watt a -160 gradi per 2 minuti? Il tutto usa circa 1.5 L di azoto e costa circa 3 euro a test. Non è folle?

Dopo essermi preso il record del mondo su Geekbench3 sono passato a Cinebench R20, che è noccioline in confronto. Il test è a malapena di 5 secondi e anche se il carico è abbastanza pesante, non è devastante. Il risultato varia un po' ma è normale su questo tipo di setup.

Dopo un paio di minuti a far girare benchmark il record è fatto. A questo punto si è fatta ora di chiudere per la giornata. La memoria all’interno è un blocco di ghiaccio e tutto funziona bene, ma credo sia meglio mollare finché tutto funziona ancora.

Durante il secondo giorno ho attaccato i benchmark che avevo trovato essere migliori con SMT spento. Wprime 1024m è stato il primo. Ho impostato i clock uguali al benchmark su Cinebench R20, il che dovrebbe facilmente funzionare con la metà dei thread abilitati. Con mia sorpresa è salito fino a 5.4 GHz con il Fabric a 1867 MHz.

Il Fabric gioca un ruolo monumentale nelle performance del 3990X, ma è l’incubo della mia esistenza da overclocker. Dobbiamo farlo girare il più veloce possibile, ma, come ho ripetuto un’infinità di volte, odia davvero essere freddo. Il processore arriva a quello che voglio chiamare un tetto di performance. Questo è stato molto evidente in Cinebench R20 quando ho combattuto con uno degli ingegneri AMD per il record del mondo. Quando usi una maggiore frequenza del Fabric, avrai una minor frequenza del processore. È così, semplice.

In un mondo perfetto, si vorrebbe la maggior frequenza del Fabric possibile (1867 MHz) per questo chip. Con il Fabric a 1867 MHz, 5.1 GHz è la frequenza stabile massima per il core e permette un punteggio di 39.000 in Cinebench R20. Se abbassi il Fabric a 1600 MHz, arriverai a 5.27 GHz sul core, e otterrai sempre 39.000 punti nello stesso benchmark. Se dividi la differenza e fai girare il Fabric a 1733 MHz, permetterai al core di andare a 5.2 GHz ma otterrai sempre 39.000 punti su R20. Questo è il motivo per cui lo chiamo tetto di performance: puoi usare qualsiasi combinazione di frequenza Fabric e del core al loro limite, ma otterrai lo stesso punteggio.

Si può totalmente annullare questo tetto di performance disabilitando il SMT. Puoi far girare il Fabric a 1867 MHz e allo stesso tempo alzare al massimo la CPU, come visto nel record wPrime a 5.4 GHz. Abbassare la frequenza del Fabric non è necessario. Perché succede? Non ne sono sicuro, ma ora che basandoci sui fatti sappiamo che accade, forse qualcuno potrà cercare di capirne il perché.

TLDR

  • Record del mondo Wprime1024 
  • Record del mondo GPUPI 1B
  • Record del mondo Geekbench 3
  • Record del mondo Cinebench R20
  • Record del mondo X265 1080p
  • Record del mondo Cinebench R15
  • Record del mondo Cinebench R11.5
  • 32 Core Record X265 4K
  • 32 Core Record Wprime32
  • Record di frequenza su Ryzen Threadripper 3990X : 5749MHz

Dal punto di vista della potenza, a 1.65V sul core, in base al benchmark, il sistema usava dai 1200 ai 2000 watt. In idle dentro il sistema operativo usava 375 watt, che sono quasi l’intero budget di energia usato da un Core i9-9900K sotto carico. Come risultato, devi versare costantemente azoto liquido sopra il 3990X dal momento che lo fai salire fino a che non lo lasci scendere.

Considerato tutto, il mondo è pronto per questa CPU? Al di fuori del mercato professionale questa è solo una dimostrazione delle capacità di AMD. Perché la penso così? Beh, prima di tutto non conosco nessuno che avrebbe intenzione di spendere 4000 euro per un processore. E Windows non sembra ancora pronto per 128 thread su un computer da tutti i giorni.

Non fraintendetemi: data un’occhiata ai risultati. Non abbiamo mai visto nulla che è minimamente in grado di fare ciò che questi processori possono fare. Questa è una supercar, non una macchina con cui andare a fare la spesa tutti i giorni, la cosa mi sta bene. Fa anche un buon lavoro nel far sembrare il Threadripper 3970X un affare a 2000 euro: puoi dimostrarti quanto sei stato parsimonioso nel fare lo spaccone per i 32 core.