image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Dashlane aggiunge la protezione che rende il phishing impossibile Dashlane aggiunge la protezione che rende il phishing imposs...
Immagine di 93€ per un mini PC? No, non è uno scherzo. Guarda qui 93€ per un mini PC? No, non è uno scherzo. Guarda qui...

Matrici Single Instruction Multiple Data

Dopo aver fatto una panoramica sulla nuova scheda ATI/AMD HD 2900 XT è giunto il momento di entrare più nel dettaglio con un approfondimento tecnico sull'architettura del chip R600.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Pubblicato il 14/05/2007 alle 17:59 - Aggiornato il 15/03/2015 alle 01:14
  • AMD R600 - HD 2900XT : analisi tecnica approfondita
  • Il nuovo progetto - panoramica di R600
  • Il Command Processor (CP)
  • Setup Engine
  • Ultra-Threaded Dispatch Processor
  • Sequencing
  • Virtualizzazione
  • Come funziona il tutto? Efficienza, Parallelismo e Latenze
  • Matrici Single Instruction Multiple Data
  • Unità Texture - Architettura
  • Accesso alla memoria
  • Render Back-Ends - Dall'AA alla Z
  • Z Buffers e HiZ
  • Interfaccia di memoria e distribuzione

Matrici Single Instruction Multiple Data

Come menzionato in precedenza, ATI ha usato nelle sue matrici delle very large instruction Words (VLIW), con lunghezza di 64 o 128 bit.  La società ha scelto questo approccio siccome ogni matrice è composta da un certo numero di stream processor (80 per la HD 2900 XT). Ogni stream processor ha a sua volta 5 processori shader superscalari, un'unità di branch execution e dei registri a scopo generico (GPR) dove immagazzinare dati d'input, valori temporanei e dati d'output.

In  tutto ci sono approssimativamente 6 TB/s di ampiezza di banda per tutti gli stream processor. Ogni operazione di lettura/scrittura agisce su 32 bit, che possono essere combinati per giungere a 64 o 128 bit.

Per rendere il tutto efficiente, ogni unità deve lavorare in maniera indipendente da ciascun altra in modo super scalare. L'arbitraggio delle SIMD e i prelievi dalle cache sono eseguiti contemporaneamente alle istruzioni durante ogni singolo ciclo.

SIMD Arrays

ATI ha diviso la vector unit in quattro unità scalari. Dal precedente progetto, ATI ha preso le cinque ALU per gestire un Vec4+1 o vettore più scalare. L'azienda ha utilizzato proprio la stessa sistemazione ma l'ha resa superscalare e indipendente. Non è più in un formato vettoriale. Ci sono cinque unità scalari, ognuna in grado di gestire operazioni floating point MADD e integer.

L'unità più grande effettua alcune funzionalità aggiuntive che ATI non ha voluto distribuire su tutte le unità disponibili. Alcune di queste operazioni sono, per esempio, la conversione float-to-fixed o altre operazioni trascendentali come il sin, cos, log, square root, e, pi, e altri calcoli. Questa assomiglia molto all'unità specializzata presente all'interno del chip G80 di Nvidia. Questi calcoli "speciali" sono fatti meno frequentemente rispetto altre istruzioni fondamentali, quindi ATI ha pensato che una sola unità su cinque sia sufficiente. Operazioni di tipo MADD sono più popolari per quanto riguarda i vertex, mentre per i pixel non è così. In questo caso operazioni trascendentali sono necessarie, per esempio, per la normalizzazione che può impattare notevolmente sulle prestazioni. Al momento, tuttavia, ATI afferma che tali operazioni non sono un problema, e non lo saranno nemmeno per prossimo futuro.

Ancora una volta ATI utilizza un'unità di branch execution poiché ci sono due tipi di branch. Uno molto pesante, che necessità che l'intero SIMD lavori a un'intera nuova parte di codice. Questo è gestito da sequencer, arbitri e ultra dispatch processor (controller). In altri casi, ha invece più senso gestire il codice tramite "predizione", saltando una o due istruzioni anziché effettuare istruzioni semplici. Questa "predizione" può essere gestita direttamente dall'ALU.

Collegata alle ALU c'è un'ampia fetta di memoria per l'archiviazione dati. Stiamo parlando dei GPR, cioè General Purpose Register. In questi registri vengono immagazzinati tutte le variabili dei thread dormienti, come i risultati di vari calcoli o i dati necessari per altri calcoli.

Con gli shader unificati le risorse a disposizione sono le stesse per ogni tipo di calcolo. Non dovrebbe esserci nessun vantaggio per vertex, pixel o gemoetry shader poiché si tratta solo di istruzioni che devono essere eseguite, qualsiasi sia lo shading.

Un nuovo hardware è accompagnato da nuove idee su come utilizzarlo. Gli sviluppatori hanno un approccio diverso rispetto a quanto accadeva in passato. Un esempio che abbiamo visto è la tesselizzazione da una displacement map per creare un ambiente geometricamente molto complesso, come succede con la demo di Ruby.

Leggi altri articoli
  • AMD R600 - HD 2900XT : analisi tecnica approfondita
  • Il nuovo progetto - panoramica di R600
  • Il Command Processor (CP)
  • Setup Engine
  • Ultra-Threaded Dispatch Processor
  • Sequencing
  • Virtualizzazione
  • Come funziona il tutto? Efficienza, Parallelismo e Latenze
  • Matrici Single Instruction Multiple Data
  • Unità Texture - Architettura
  • Accesso alla memoria
  • Render Back-Ends - Dall'AA alla Z
  • Z Buffers e HiZ
  • Interfaccia di memoria e distribuzione

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Hai comprato Switch 2? Ecco 10 cose da NON fare assolutamente
  • #2
    AMD Radeon RX 9060 XT 16GB, la migliore sotto i 400 euro | Test & Recensione
  • #3
    Addio lenti graduate, l'autofocus arriva sugli occhiali da vista
  • #4
    La storia della Ford Focus ST è finita per sempre
  • #5
    La GPU più veloce del mondo è un'integrata Intel
  • #6
    Huawei Watch Fit4 Pro vs Apple Watch Ultra 2: ha davvero senso spendere il triplo?
Articolo 1 di 5
93€ per un mini PC? No, non è uno scherzo. Guarda qui
Un mini PC valido a soli 93€? Con questo coupon è realtà! A permette questo affare è Aliexpress, che offre il piccolo Bmax B3 a un prezzo stracciato.
Immagine di 93€ per un mini PC? No, non è uno scherzo. Guarda qui
Leggi questo articolo
Articolo 2 di 5
Dashlane aggiunge la protezione che rende il phishing impossibile
Dashlane introduce il supporto per chiavi di sicurezza FIDO2: accesso senza password al vault con autenticazione hardware anti-phishing.
Immagine di Dashlane aggiunge la protezione che rende il phishing impossibile
1
Leggi questo articolo
Articolo 3 di 5
Come installare SteamOS su qualsiasi PC
Ora è possibile installare SteamOS anche su PC Desktop e laptop: in questa guida ti spieghiamo come fare e come funziona.
Immagine di Come installare SteamOS su qualsiasi PC
6
Leggi questo articolo
Articolo 4 di 5
Intel fa una mossa drastica per aumentare i profitti
Intel punta a massimizzare il valore per gli azionisti sotto la guida di Lip-Bu Tan, concentrandosi su strategie mirate per il rilancio dell'azienda.
Immagine di Intel fa una mossa drastica per aumentare i profitti
3
Leggi questo articolo
Articolo 5 di 5
NVIDIA RTX 5050, ecco quando dovrebbe arrivare e le sue specifiche
NVIDIA prepara la RTX 5050 entry-level con architettura Blackwell: 2.560 CUDA core, 8 GB GDDR6 e TDP 130W. Ecco per quando è attesa.
Immagine di NVIDIA RTX 5050, ecco quando dovrebbe arrivare e le sue specifiche
17
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.