Alcune definizioni

CUDA, il nuovo linguaggio di programmazione per le GPU Nvidia, promette grandi risultati e mostra le schede video sotto una nuova luce. Cerchiamo di capire un po' di più cosa ci riserva CUDA.

a cura di Andrea Ferrario

Editor in Chief

Pubblicato il 30/06/2008 alle 11:16 - Aggiornato il 15/03/2015 alle 01:14

Alcune definizioni

Prima di tuffarci in CUDA, diamo le definizioni di alcuni termini che compaiono nella documentazione Nvidia. L'azienda ha scelto di usare una terminologia speciale che può essere difficile da masticare. Prima dobbiamo definire cos'è un thread in CUDA, poiché questo termine non è sinonimo di "thread per CPU", e non è nemmeno equivalente a quello che definiamo "thread" nei nostri articoli dedicati alle GPU. Un thread, nella terminologia CUDA, è un elemento composto dai dati base che devono essere elaborati. Diversamente dai thread delle CPU, i thread CUDA sono notevolmente più "leggeri", quindi il cambio di contesto tra due thread non è un'operazione molto impegnativa.

Il secondo termine che si incontra di frequente nella documentazione CUDA è " iswarp ". Il termine deriva dalla tecnologia di weaving (processo di interlacciamento dei thread); un warp in CUDA è un gruppo di 32 thread, la minima dimensione dei dati elaborati in SIMD da un multiprocessore CUDA.

Tuttavia, in CUDA, anziché manipolare direttamente warp, lavorerete con blocchi (blocks) che possono contenere dai 64 ai 512 thread.

Infine, questi blocchi si riuniscono in "grids" (griglie). Il vantaggio di questo raggruppamento è che il numero di blocchi elaborati simultaneamente dalla GPU è vicino al limite delle risorse hardware, come vedremo più avanti. Il numero di blocchi in una griglia (grid) rende possibile l'applicazione del kernel a una grande quantità di thread con una singola chiamata, senza doversi preoccupare delle risorse. La CUDA runtime si occupa di tutti i lavori necessari, mostrando una flessibilità estrema. Se l'hardware dispone di poche risorse, eseguirà i blocchi sequenzialmente; se dispone invece di molte unità processuali, potrà elaborare i dati in parallelo. Questo significa che lo stesso codice può essere gestito, in maniera adeguata, sia dalle GPU entry-level che da quelle high-end, e naturalmente anche dai modelli a venire.

Gli altri termini frequenti nelle API CUDA sono usati per identificare la CPU, che è chiamata "host", e la GPU, a cui si fa riferimento come "device".

Leggi altri articoli

Articolo 1 di 5

Uso della VRAM ridotto all'osso con la nuova versione del DLSS

Le ottimizzazioni della VRAM hanno raggiunto un nuovo traguardo con l'ultimo aggiornamento alla tecnologia DLSS 4 di NVIDIA.

Leggi questo articolo

Articolo 2 di 5

Questa è la tech che salverà le schede video da 8GB

Una ricerca di AMD dimostra come generare alberi e vegetazione in tempo reale riduca drasticamente l'uso della VRAM nei rendering 3D di diverse volte.

Leggi questo articolo

Articolo 3 di 5

Queste DRAM consumano il 20% in meno e performano di più

L'industria delle memorie DRAM sta assistendo a una rivoluzione che potrebbe ridefinire i parametri di efficienza energetica e delle prestazioni.

Leggi questo articolo

Articolo 4 di 5

Mediaworld fa il NO IVA, ma Amazon batte il prezzo su questo tablet Lenovo

Il NO IVA di Mediaworld non basta! Amazon ha il tablet Lenovo Tab M11 a un prezzo ancora più basso, solo 138€. Tra i migliori tablet entry level!

Leggi questo articolo

Articolo 5 di 5

NVIDIA pensa già alle RTX 50 SUPER: ecco quando arriveranno

Le nuove RTX 50 SUPER debutteranno probabilmente al CES 2026. Le novità riguardano principalmente la VRAM, aumentata del 50% rispetto ai modelli base.

Leggi questo articolo