image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di AMD Ryzen 5 7500X3D: la 3D V-Cache economica costa troppo? | Test & Recensione AMD Ryzen 5 7500X3D: la 3D V-Cache economica costa troppo? |...
Immagine di Windows 26 riprende l’eredità di Vista e 7, ma con stile Windows 26 riprende l’eredità di Vista e 7, ma con stile...

Pag 2

CUDA, il nuovo linguaggio di programmazione per le GPU Nvidia, promette grandi risultati e mostra le schede video sotto una nuova luce. Cerchiamo di capire un po' di più cosa ci riserva CUDA.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Pubblicato il 30/06/2008 alle 11:16 - Aggiornato il 15/03/2015 alle 01:14
  • Nvidia CUDA, GPU all'inizio di una nuova era
  • Nel frattempo
  • Viva la GeForce FX!
  • L'avvento della GPGPU
  • Le API CUDA
  • Alcune definizioni
  • La teoria: CUDA dal punto di vista hardware
  • Pag 2
  • La teoria: CUDA dal punto di vista software
  • In pratica
  • Prestazioni
  • Analisi
  • Conclusioni
  • Intervista
  • Pag 2

CUDA dal punto di vista hardware, continua

Quest'area di memoria permette ai thread presenti nello stesso blocco di comunicare tra loro. É importante enfatizzare questo concetto: tutti i thread presenti nello stesso blocco sono eseguiti dallo stesso multiprocessore. L'assegnamento dei blocchi ai vari multiprocessori, invece, è del tutto separato, il che significa che due thread di blocchi differenti non possono comunicare tra loro durante la loro esecuzione. L'uso della memoria, quindi è piuttosto complicato, ma non per questo è poco efficiente. Eccezione fatta per i casi in cui diversi thread cerchino di accedere allo stesso banco di memoria, creando conflitti, l'accesso alla memoria condivisa è veloce quanto l'accesso ai registri.

La memoria condivisa non è la sola memoria a cui i multiprocessori possono accedere. Possono, naturalmente, fare appello anche alla memoria video, anche se questa ha un bandwidth più basso e una latenza più alta. Quindi per limitare accessi troppo frequenti a questa memoria, Nvidia ha dotato i suoi multiprocessori con una cache (8 kb per multiprocessore) per l'accesso alle costanti e alle texture.

I multiprocessori hanno anche 8192 registri condivisi tra tutti i thread di tutti i blocchi attivi in un multiprocessore. Il numero dei blocchi attivi per multiprocessore non può essere maggiore di otto, e il numero dei warp attivi è limitato a 24 (768 thread). Quindi, una 8800 GTX può elaborare fino a 12228 thread nello stesso istante. Questo limite è stato impostato per aiutare il dimensionamento degli algoritmi in funzione delle risorse disponibili.

Ottimizzare un programma CUDA, quindi, vuol dire inizialmente trovare il miglior rapporto tra il numero di blocchi e la loro dimensione - più thread per blocco saranno utili per mascherare la latenza delle operazioni in memoria, ma allo stesso tempo il numero di registri disponibili per ogni thread è ridotto. Un blocco di 512 thread, inoltre, risulterebbe particolarmente inefficiente, poiché su un multiprocessore può essere attivo un solo blocco, e potenzialmente si sprecheranno 256 thread. Quindi, Nvidia consiglia di usare blocchi composti da 128 a 256 threads, dimensione che offre il miglior compromesso per mascherare la latenza e il numero di registri necessario per la maggior parte dei kernel.

Leggi altri articoli
  • Nvidia CUDA, GPU all'inizio di una nuova era
  • Nel frattempo
  • Viva la GeForce FX!
  • L'avvento della GPGPU
  • Le API CUDA
  • Alcune definizioni
  • La teoria: CUDA dal punto di vista hardware
  • Pag 2
  • La teoria: CUDA dal punto di vista software
  • In pratica
  • Prestazioni
  • Analisi
  • Conclusioni
  • Intervista
  • Pag 2

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Lavorare 72 ore a settimana, il nuovo modello che piace a USA e Cina
  • #2
    Scoperti nuovi indizi sulle origini di Homo sapiens
  • #3
    Unieuro non si ferma: le promozioni del Black Friday continuano
  • #4
    Windows 26 riprende l’eredità di Vista e 7, ma con stile
  • #5
    22% di sconto su Amazon con appena 25€ di spesa
  • #6
    Scatta il blocco sui siti porno: cosa succede ora?
Articolo 1 di 5
Windows 26 riprende l’eredità di Vista e 7, ma con stile
Il designer Abdi propone un Windows 26 che recupera l'estetica di Vista e 7 con il Liquid Glass, mentre Microsoft punta su AI e piattaforme agentiche.
Immagine di Windows 26 riprende l’eredità di Vista e 7, ma con stile
9
Leggi questo articolo
Articolo 2 di 5
AMD Ryzen 5 7500X3D: la 3D V-Cache economica costa troppo? | Test & Recensione
L'ultimo nato con 3D V-Cache ha le carte in regola per finire in tutti i PC da gaming entry level, ma dovrà avere il giusto prezzo.
Immagine di AMD Ryzen 5 7500X3D: la 3D V-Cache economica costa troppo? | Test & Recensione
6
Leggi questo articolo
Articolo 3 di 5
La nuova Steam Machine esiste davvero (e non è sola)
Valve annuncia una nuova Steam Machine, ma anche un visore VR standalone Steam Frame e un nuovo controller ibrido.
Immagine di La nuova Steam Machine esiste davvero (e non è sola)
6
Leggi questo articolo
Articolo 4 di 5
AMD Zen 6: la rivoluzione dei 2 nanometri è vicina
Zen 6 segna un passo storico per AMD: architettura a 2 nanometri, prestazioni AI potenziate e continuità sulla piattaforma AM5.
Immagine di AMD Zen 6: la rivoluzione dei 2 nanometri è vicina
5
Leggi questo articolo
Articolo 5 di 5
SteamOS su Arm è un'ottima notizia, non solo per la VR
L'arrivo di SteamOS su architettura Arm grazie al visore Steam Frame segna una svolta importante, dopo anni di supporto esclusivo a x86.
Immagine di SteamOS su Arm è un'ottima notizia, non solo per la VR
10
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.