image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Intel fa una mossa drastica per aumentare i profitti Intel fa una mossa drastica per aumentare i profitti...
Immagine di Come installare SteamOS su qualsiasi PC Come installare SteamOS su qualsiasi PC...

Come funziona il tutto? Efficienza, Parallelismo e Latenze

Dopo aver fatto una panoramica sulla nuova scheda ATI/AMD HD 2900 XT è giunto il momento di entrare più nel dettaglio con un approfondimento tecnico sull'architettura del chip R600.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Pubblicato il 14/05/2007 alle 17:59 - Aggiornato il 15/03/2015 alle 01:14
  • AMD R600 - HD 2900XT : analisi tecnica approfondita
  • Il nuovo progetto - panoramica di R600
  • Il Command Processor (CP)
  • Setup Engine
  • Ultra-Threaded Dispatch Processor
  • Sequencing
  • Virtualizzazione
  • Come funziona il tutto? Efficienza, Parallelismo e Latenze
  • Matrici Single Instruction Multiple Data
  • Unità Texture - Architettura
  • Accesso alla memoria
  • Render Back-Ends - Dall'AA alla Z
  • Z Buffers e HiZ
  • Interfaccia di memoria e distribuzione

Come funziona il tutto? Efficienza, Parallelismo e Latenze

Perché AMD mette in pista così tanti thread e arbitra tutte le risorse? Perché non eseguire le operazioni passo per passo, sequenzialmente come faremmo noi esseri umani? Il motivo sta nella continua ricerca della riduzione della latenza. Per eseguire un compito o prelevare un dato serve tempo. Se lo shader dice "vai a prelevare una texture", anche se da cache, deve prima eseguire un calcolo "leave of detail" (LOD) sull'indirizzo della texture, fare un controllo di cache, ottenere i dati dalla cache, filtrarli e infine trasferirli. Questo processo può richiedere almeno una dozzina di cicli. Se c'è un cache miss, ovvero il dato non esiste in cache e va caricato da più lenta memoria esterna DRAM, possono passare centinaia di cicli, se non migliaia.

Nella realtà non c'è solo la singola unità dell'esempio in azione, ma anche altre componenti hadware che avviano richieste di memoria in continuazione e contemporaneamente o quasi. Secondo AMD ci possono essere più di 80 client in lettura e ognuno vuole prelevare qualcosa dalla memoria. Fortunatamente l'ampiezza di banda della memoria è aumentata a 105GB/s usando GDDR3 e 160 GB/s con GDDR4.

A fronte di una banda così ampia, però,  c'è una moltitudine di client che ne chiedono ancora di più. Mentre è importante che questi possano continuare a fare richieste, è ancora più importante non rispondere a tutti subito. Le richieste vanno prima organizzate in modo da ottimizzarle per un migliore uso della memoria, cercando per esempio di prelevare tutti i dati possibili su pagine di DRAM già aperte.  Per mantenere livelli di banda elevati bisogna sfruttare quindi la memoria in maniera molto efficiente. Per fare ciò bisogna che le varie componenti del sistema si abituino ad aspettare. Come anticipato è normale che per i dati ci siano attese di dozzine, centinaia e anche migliaia di cicli.

È proprio per camuffare queste latenze che il sistema lavora in parallelo. Quando l'hardware termina un'operazione su un certo dato, lo congela in attesa di poterci eseguire l'operazione successiva. Nel frattempo, l'hardware risveglia o preleva un altro thread e ci lavora, per poi rimetterlo a dormire e via dicendo.

Un processore può lavorare solo pochi thread contemporaneamente, mentre una GPU ne può accomodare a migliaia. ATI adotta un workload di 16 pixel per thread. Se li moltiplichiamo per il numero di thread, scopriamo che in ogni momento ci sono negli shader decine di migliaia di pixel. Con questa grossa mole di lavoro in parallelo, non dovrebbero esserci problemi a mascherare le latenze.

Leggi altri articoli
  • AMD R600 - HD 2900XT : analisi tecnica approfondita
  • Il nuovo progetto - panoramica di R600
  • Il Command Processor (CP)
  • Setup Engine
  • Ultra-Threaded Dispatch Processor
  • Sequencing
  • Virtualizzazione
  • Come funziona il tutto? Efficienza, Parallelismo e Latenze
  • Matrici Single Instruction Multiple Data
  • Unità Texture - Architettura
  • Accesso alla memoria
  • Render Back-Ends - Dall'AA alla Z
  • Z Buffers e HiZ
  • Interfaccia di memoria e distribuzione

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Addio lenti graduate, l'autofocus arriva sugli occhiali da vista
  • #2
    La GPU più veloce del mondo è un'integrata Intel
  • #3
    Huawei Watch Fit4 Pro vs Apple Watch Ultra 2: ha davvero senso spendere il triplo?
  • #4
    Vuoi completare Nintendo Switch 2 Welcome Tour? Devi spendere almeno 100 euro
  • #5
    Come installare SteamOS su qualsiasi PC
  • #6
    93€ per un mini PC? No, non è uno scherzo. Guarda qui
Articolo 1 di 5
Come installare SteamOS su qualsiasi PC
Ora è possibile installare SteamOS anche su PC Desktop e laptop: in questa guida ti spieghiamo come fare e come funziona.
Immagine di Come installare SteamOS su qualsiasi PC
6
Leggi questo articolo
Articolo 2 di 5
Intel fa una mossa drastica per aumentare i profitti
Intel punta a massimizzare il valore per gli azionisti sotto la guida di Lip-Bu Tan, concentrandosi su strategie mirate per il rilancio dell'azienda.
Immagine di Intel fa una mossa drastica per aumentare i profitti
3
Leggi questo articolo
Articolo 3 di 5
Le nuove Radeon spaccano, ma nessuno le compra: perché?
Il mercato delle schede grafiche desktop ha vissuto nel primo trimestre del 2025 uno scenario paradossale che ha colto di sorpresa gli analisti di settore.
Immagine di Le nuove Radeon spaccano, ma nessuno le compra: perché?
26
Leggi questo articolo
Articolo 4 di 5
Configurazione AMD a tema ASUS TUF per giocare in 4K | 2025
Una configurazione PC "a tema" per chi vuole un PC da gaming di fascia alta con il design militare tipico dei prodotti ASUS TUF.
Immagine di Configurazione AMD a tema ASUS TUF per giocare in 4K | 2025
2
Leggi questo articolo
Articolo 5 di 5
Troppe ore al pc? Non vi serve una doccia, ci pensa ZOTAC
ZOTAC, azienda storicamente conosciuta per le sue schede grafiche e componenti da PC, ha deciso di esplorare un territorio completamente nuovo.
Immagine di Troppe ore al pc? Non vi serve una doccia, ci pensa ZOTAC
1
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.