image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Windows: 10 cose che il 99% delle persone non conosce Windows: 10 cose che il 99% delle persone non conosce...
Immagine di Dite addio all'hack più famoso per attivare Windows 11 Dite addio all'hack più famoso per attivare Windows 11...

Come funziona il tutto? Efficienza, Parallelismo e Latenze

Dopo aver fatto una panoramica sulla nuova scheda ATI/AMD HD 2900 XT è giunto il momento di entrare più nel dettaglio con un approfondimento tecnico sull'architettura del chip R600.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Pubblicato il 14/05/2007 alle 17:59 - Aggiornato il 15/03/2015 alle 01:14
  • AMD R600 - HD 2900XT : analisi tecnica approfondita
  • Il nuovo progetto - panoramica di R600
  • Il Command Processor (CP)
  • Setup Engine
  • Ultra-Threaded Dispatch Processor
  • Sequencing
  • Virtualizzazione
  • Come funziona il tutto? Efficienza, Parallelismo e Latenze
  • Matrici Single Instruction Multiple Data
  • Unità Texture - Architettura
  • Accesso alla memoria
  • Render Back-Ends - Dall'AA alla Z
  • Z Buffers e HiZ
  • Interfaccia di memoria e distribuzione

Come funziona il tutto? Efficienza, Parallelismo e Latenze

Perché AMD mette in pista così tanti thread e arbitra tutte le risorse? Perché non eseguire le operazioni passo per passo, sequenzialmente come faremmo noi esseri umani? Il motivo sta nella continua ricerca della riduzione della latenza. Per eseguire un compito o prelevare un dato serve tempo. Se lo shader dice "vai a prelevare una texture", anche se da cache, deve prima eseguire un calcolo "leave of detail" (LOD) sull'indirizzo della texture, fare un controllo di cache, ottenere i dati dalla cache, filtrarli e infine trasferirli. Questo processo può richiedere almeno una dozzina di cicli. Se c'è un cache miss, ovvero il dato non esiste in cache e va caricato da più lenta memoria esterna DRAM, possono passare centinaia di cicli, se non migliaia.

Nella realtà non c'è solo la singola unità dell'esempio in azione, ma anche altre componenti hadware che avviano richieste di memoria in continuazione e contemporaneamente o quasi. Secondo AMD ci possono essere più di 80 client in lettura e ognuno vuole prelevare qualcosa dalla memoria. Fortunatamente l'ampiezza di banda della memoria è aumentata a 105GB/s usando GDDR3 e 160 GB/s con GDDR4.

A fronte di una banda così ampia, però,  c'è una moltitudine di client che ne chiedono ancora di più. Mentre è importante che questi possano continuare a fare richieste, è ancora più importante non rispondere a tutti subito. Le richieste vanno prima organizzate in modo da ottimizzarle per un migliore uso della memoria, cercando per esempio di prelevare tutti i dati possibili su pagine di DRAM già aperte.  Per mantenere livelli di banda elevati bisogna sfruttare quindi la memoria in maniera molto efficiente. Per fare ciò bisogna che le varie componenti del sistema si abituino ad aspettare. Come anticipato è normale che per i dati ci siano attese di dozzine, centinaia e anche migliaia di cicli.

È proprio per camuffare queste latenze che il sistema lavora in parallelo. Quando l'hardware termina un'operazione su un certo dato, lo congela in attesa di poterci eseguire l'operazione successiva. Nel frattempo, l'hardware risveglia o preleva un altro thread e ci lavora, per poi rimetterlo a dormire e via dicendo.

Un processore può lavorare solo pochi thread contemporaneamente, mentre una GPU ne può accomodare a migliaia. ATI adotta un workload di 16 pixel per thread. Se li moltiplichiamo per il numero di thread, scopriamo che in ogni momento ci sono negli shader decine di migliaia di pixel. Con questa grossa mole di lavoro in parallelo, non dovrebbero esserci problemi a mascherare le latenze.

Leggi altri articoli
  • AMD R600 - HD 2900XT : analisi tecnica approfondita
  • Il nuovo progetto - panoramica di R600
  • Il Command Processor (CP)
  • Setup Engine
  • Ultra-Threaded Dispatch Processor
  • Sequencing
  • Virtualizzazione
  • Come funziona il tutto? Efficienza, Parallelismo e Latenze
  • Matrici Single Instruction Multiple Data
  • Unità Texture - Architettura
  • Accesso alla memoria
  • Render Back-Ends - Dall'AA alla Z
  • Z Buffers e HiZ
  • Interfaccia di memoria e distribuzione

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Dite addio all'hack più famoso per attivare Windows 11
  • #2
    Addio certezze: il diamante non è più il numero uno
  • #3
    Amazon abbandona Android per la pirateria
  • #4
    Steam Machine sarà la morte di PlayStation e Xbox?
  • #5
    LEFANT scatenato per il Black Friday: robot scontati fino al 72%
  • #6
    Un supercomputer rivela la vera forma dei nuclei atomici
Articolo 1 di 5
Dite addio all'hack più famoso per attivare Windows 11
Microsoft ha bloccato gli script MAS che permettevano di attivare Windows 11 senza licenza, inasprendo la lotta alla pirateria software.
Immagine di Dite addio all'hack più famoso per attivare Windows 11
20
Leggi questo articolo
Articolo 2 di 5
Windows: 10 cose che il 99% delle persone non conosce
La storia di Windows è costellata di eventi, curiosità ed easter egg, ma siete sicuri di conoscerli tutti? Vi racconto 10 curiosità che in pochi conoscono!
Immagine di Windows: 10 cose che il 99% delle persone non conosce
9
Leggi questo articolo
Articolo 3 di 5
DJI Neo 2: il selfie drone tascabile diventa quasi perfetto | Test & Recensione
La nostra prova del nuovo drone ultra-compatto di DJI: miglioramenti significativi, ma anche limiti da considerare.
Immagine di DJI Neo 2: il selfie drone tascabile diventa quasi perfetto | Test & Recensione
4
Leggi questo articolo
Articolo 4 di 5
Gli affari sulle CPU ci sono già! AMD conviene ora più che mai
Solitamente si aspetta il Black Friday di Amazon per fare qualche affare sull'hardware. Oggi è Aliexpress a proporre le migliori occasioni.
Immagine di Gli affari sulle CPU ci sono già! AMD conviene ora più che mai
Leggi questo articolo
Articolo 5 di 5
Lenovo valorizza il ThinkPad X1 al Black Friday con un coupon personalizzato
Fino al 20 novembre, Lenovo fa in modo che il suo ThinkPad X1 sia tra i notebook più convenienti di tutta l'offerta Black Friday.
Immagine di Lenovo valorizza il ThinkPad X1 al Black Friday con un coupon personalizzato
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.