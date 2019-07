64 core a 7 nanometri, 8 canali DDR5 e 72 linee PCIe 5.0 per il processore universale Prodigy di Tachyum che conta di sverniciare CPU, GPU e TPU nel 2020.

Tachyum è una startup che ha appena ricevuto un finanziamento da 25 milioni di dollari. L’azienda ha presentato l’anno scorso a Hot Chips la sua famiglia di chip “Prodigy Universal Processor” e ha intenzione di eseguire il tape out del chip quest’anno in previsione del debutto nella seconda metà del 2020.

Secondo Tachyum il chip sarà in grado di assicurare prestazioni superiori a CPU, GPU e TPU, il tutto offrendo una programmabilità tipica delle CPU ma consumando 10 volte meno.

Più nello specifico il Prodigy sarà “più veloce di uno Xeon e più piccolo di un chip ARM“. L’IPC dovrebbe quindi essere migliore rispetto all’architettura Skylake (che si trova in tutti i chip Core di Intel dalla fine del 2015), pur in dimensioni molto contenute.

Tachyum userà il processo produttivo a 7 nanometri ad alte prestazioni di TSMC, lo stesso dei processori AMD basati su architettura Zen 2, cosa che dovrebbe consentire al chip di occupare 290 mm2 pur mettendo a disposizione 64 core.

A titolo di confronto, il progetto AMD Rome (EPYC di seconda generazione) ha otto chiplet a 8 core da 74 mm2 per un totale di 592 mm2, accompagnati da un I/O die più grande per un’area occupata dal silicio di oltre 1000 mm2.

Prodigy vanterà anche 8 canali DDR5 e 72 linee PCIe 5.0, supporterà 2x 400G Ethernet e memoria HBM3 opzionale. Il chip lascia però un po’ a desiderare sul fronte della cache, con soli 32 MB di L2/L3.

Ciò però non dovrebbe compromettere le sue prestazioni: nonostante i 64 core infatti, i chip dovrebbero lavorare a 4 GHz, anche durante carichi di lavoro HPC e IA, consumando solamente 180W. Come le architetture Skylake-SP e Cascade Lake-SP, Prodigy avrà due unità vettoriali da 512 bit per core, un’ampiezza doppia rispetto a Zen 2.

Tutto troppo bello per essere vero? Tachyum non sembra scherzare affatto: l’azienda ha affermato che i dati viaggiano lungo brevi connessioni, mitigando il problema della velocità. La caratteristica principale, tuttavia, sembra essere l’esecuzione out-of-order in software, fatta dal compilatore in anticipo piuttosto che in fase di esecuzione. È questo che rende il core così piccolo. Affinché tutto funzioni i software esistenti dovranno essere ricompilati.

In conclusione Tachyum sostiene di aver sviluppato un “processore universale” che pretende di consumare 10 volte meno e occupare pochissimo spazio, con costi tre volte inferiori. L’azienda ha inoltre aperto alla possibilità di realizzare un sistema exascale con ben 250.000 chip Prodigy.