image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Aggiornare Windows 10 gratis? Vi basta avere dei Microsoft Point Aggiornare Windows 10 gratis? Vi basta avere dei Microsoft P...
Immagine di Apple ascolta le critiche e rimette a posto il Finder Apple ascolta le critiche e rimette a posto il Finder...

Ecco TensorRT, la libreria che potenza l'IA generativa su Windows

TensorRT-LLM for Windows è una libreria open-source che incrementa le prestazioni dell'inferenza per i più recenti modelli di IA

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author

Pubblicato il 18/10/2023 alle 01:10

L'Intelligenza Artificiale Generativa sta ridefinendo il panorama dell'informatica di consumo, portando miglioramenti significativi in campi come il gaming, la creatività, la produzione video, la produttività e lo sviluppo.

Questa rivoluzione è resa possibile grazie alle unità di elaborazione dedicate all'IA, denominate Tensor Cores, presenti nelle schede GeForce RTX e NVIDIA RTX, che stanno portando il potenziale dell'Intelligenza Artificiale Generativa a oltre 100 milioni di PC, e postazioni di lavoro, con sistema operativo Windows.

Oggi, il computing con IA generativa su PC ha fatto un balzo in avanti, diventando fino a 4 volte più veloce grazie a TensorRT-LLM for Windows, una libreria open-source che incrementa le prestazioni dell'inferenza per i più recenti modelli di grandi dimensioni basati sul linguaggio naturale, come Llama 2 e Code Llama. 

NVIDIA ha anche reso disponibili strumenti per gli sviluppatori che desiderano accelerare i loro modelli di Linguaggio Naturale di Grandi Dimensioni (LLM), compresi script per ottimizzare modelli personalizzati con TensorRT-LLM, modelli open-source ottimizzati con TensorRT e un progetto di riferimento che dimostra sia la velocità che la qualità delle risposte dei LLM.

L'accelerazione di TensorRT è ora applicabile anche a Stable Diffusion, una tecnologia impiegata nella creazione di opere d'arte sorprendenti. Grazie all'integrazione con la popolare interfaccia Web UI di Automatic1111, Stable Diffusion con accelerazione TensorRT può far funzionare il modello di IA generativa fino a 2 volte più velocemente rispetto alle implementazioni precedenti.

Inoltre, la versione 1.5 di RTX Video Super Resolution (VSR) è stata rilasciata come parte dell'ultimo driver Game Ready, e sarà presto disponibile anche nel prossimo driver NVIDIA Studio, in arrivo all'inizio del mese prossimo.

L'IA generativa, basata su grandi reti neurali addestrate nel linguaggio naturale, sta rivoluzionando la produttività, con applicazioni che vanno dalla chat alla sintesi di documenti, dalla scrittura di email e blog, fino all'analisi automatica dei dati e alla generazione di contenuti.

Immagine id 2072

TensorRT-LLM, una libreria dedicata all'accelerazione dell'inferenza per questi modelli, offre una significativa accelerazione, permettendo ai LLM di operare fino a 4 volte più velocemente su PC con GPU RTX.

Questa accelerazione è particolarmente utile quando si combinano le capacità dei LLM con altre tecnologie, come nel caso della generazione con recupero aumentato (RAG).

In questo scenario, un LLM viene accoppiato a una libreria di vettori, o a un database di vettori, per fornire risposte mirate basate su insiemi specifici di dati, come email degli utenti o articoli su siti web.

Un esempio concreto di questi miglioramenti è il tempo di risposta a domande complesse. In un caso, senza l'uso del RAG, la risposta fornita da un modello base LLaMa 2 è stata poco utile. Ma utilizzando il RAG con articoli recenti sulle schede GeForce caricati in una libreria di vettori collegata allo stesso modello Llama 2, la risposta corretta è stata fornita in modo molto più rapido grazie all'accelerazione di TensorRT-LLM, dimostrando come questa combinazione aumenti l'efficienza e fornisca soluzioni più intelligenti agli utenti.

TensorRT-LLM sarà presto disponibile per il download dal sito dedicato agli sviluppatori di NVIDIA, insieme a modelli open source ottimizzati con TensorRT e una demo del RAG con articoli recenti sulle schede GeForce come progetto di esempio, accessibile su ngc.nvidia.com e GitHub.com/NVIDIA.

L'IA sta rivoluzionando anche il mondo dello streaming video. RTX VSR è un passo avanti nell'elaborazione dei pixel basata sull'IA, che migliora la qualità dei contenuti video in streaming, riducendo o eliminando gli artefatti causati dalla compressione video e affinando i dettagli.

La versione 1.5 di RTX VSR è ora disponibile, offrendo una qualità visiva ancora migliore grazie a modelli aggiornati e la capacità di eliminare gli artefatti nei video riprodotti alla risoluzione nativa del display.

Questa versione supporta inoltre le GPU RTX basate sull'architettura NVIDIA Turing, comprese le RTX professionali e le GeForce RTX della serie 20.

Il ritraining del modello AI di VSR ha permesso di distinguere con precisione tra dettagli sottili e artefatti di compressione, preservando meglio i dettagli durante il processo di upscaling. Questo si traduce in immagini più nitide e definite, con dettagli più visibili.

RTX VSR 1.5 è già disponibile per gli utenti RTX tramite l'ultimo driver Game Ready e lo sarà anche nel prossimo driver NVIDIA Studio, previsto per il mese prossimo.

Fonte dell'articolo: blogs.nvidia.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    6 ventilatori da tenere d'occhio in vista del Prime Day
  • #2
    6 smart TV da tenere d'occhio in vista del Prime Day
  • #3
    6 friggitrici ad aria da tenere d'occhio in vista del Prime Day
  • #4
    Una sorprendente mod ha reso una RTX 5090 una GPU da 10.000$
  • #5
    Apple ha letto i vostri commenti furiosi e fa marcia indietro
  • #6
    Il 97% dei call center cerca di truffarti, ecco come fa
Articolo 1 di 5
Apple ascolta le critiche e rimette a posto il Finder
Apple fa marcia indietro su alcuni elementi visivi proposti per i suoi sistemi operativi di prossima generazione, dopo averli presentati al WWDC 2025.
Immagine di Apple ascolta le critiche e rimette a posto il Finder
2
Leggi questo articolo
Articolo 2 di 5
Aggiornare Windows 10 gratis? Vi basta avere dei Microsoft Point
Microsoft offre nuove opzioni per convincere gli utenti più restii al cambiamento e facilitare la transizione verso le sue ultime innovazioni tecnologiche.
Immagine di Aggiornare Windows 10 gratis? Vi basta avere dei Microsoft Point
3
Leggi questo articolo
Articolo 3 di 5
Una waifu da scrivania: ecco la vostra prossima fidanzata
Gli androidi sognano otaku elettrici? Un viaggio nel mondo digitale dove tecnologia e cultura pop giapponese si fondono in una nuova realtà virtuale.
Immagine di Una waifu da scrivania: ecco la vostra prossima fidanzata
Leggi questo articolo
Articolo 4 di 5
MSI Z790 Gaming Pro WiFi: l'equilibrio tra prestazioni e prezzo
Una scheda madre che combina caratteristiche premium e connettività avanzata senza sconfinare nei prezzi proibitivi delle soluzioni top di gamma.
Immagine di MSI Z790 Gaming Pro WiFi: l'equilibrio tra prestazioni e prezzo
1
Leggi questo articolo
Articolo 5 di 5
Questa MSI RTX 5070 non è mai costata COSI' POCO! IMPERDIBILE!
Offerta imperdibile sulla potente scheda video MSI GeForce RTX 5070 12G con DLSS 4 e Ray Tracing: risparmiate 180€ e portatevi a casa prestazioni AI all'avanguardia.
Immagine di Questa MSI RTX 5070 non è mai costata COSI' POCO! IMPERDIBILE!
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.