image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Il vero affare del weekend? -15% extra dall’app MediaWorld Il vero affare del weekend? -15% extra dall’app MediaWorld...
Immagine di EMP ti veste come un Pokémon! Collezione a tema ora in mega sconto! EMP ti veste come un Pokémon! Collezione a tema ora in mega...

Le IA possono creare file lossless di qualità superiore

Il modello linguistico multimodale Chinchilla ha compresso campioni dall'insieme di dati audio LibriSpeech superando la compressione FLAC

Advertisement

Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author @Tom's Hardware Italia

Pubblicato il 01/10/2023 alle 13:18
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

La compressione dei dati efficace è un processo che mira a ridurre le dimensioni di questi ultimi senza perdere informazioni cruciali. Quando un algoritmo, o un modello, è in grado di prevedere con precisione il prossimo elemento in una sequenza di dati, dimostra di essere in grado di rilevare i modelli nei dati stessi.

Questa abilità è strettamente collegata alla capacità di effettuare una buona compressione dei dati, e qui entra in gioco il ruolo dei modelli linguistici multimodali quali GPT-4.

In un recente articolo di ricerca pubblicato su arXiv, dal titolo "Language Modeling Is Compression" (Il Modellamento Linguistico è Compressione), alcuni ricercatori hanno svelato un dettaglio sorprendente.

Il modello linguistico multimodale di DeepMind, noto come Chinchilla 70B, è in grado di comprimere patch di immagini provenienti dal database di immagini ImageNet fino al 43,4% delle loro dimensioni originali, superando l'algoritmo di compressione PNG, che invece riesce a comprimere gli stessi dati solo al 58,5%. 

L'aspetto realmente sorprendente, però, riguarda l'audio, in quanto Chinchilla ha compresso campioni dall'insieme di dati audio LibriSpeech al solo 16,4% delle loro dimensioni grezze, superando la compressione FLAC che raggiunge solo il 30,3%.

Immagine id 1

Questi risultati dimostrano che Chinchilla, anche se è stato addestrato principalmente per il trattamento del testo, eccelle nella compressione di altri tipi di dati, spesso superando algoritmi appositamente progettati per tali compiti.

Questa scoperta apre nuove prospettive per l'utilizzo dei modelli linguistici multimodali non solo per la previsione, e la generazione di testo, ma anche per la compressione di una vasta gamma di tipi di dati.

Inoltre, negli ultimi due decenni, alcuni informatici hanno teorizzato che la capacità di comprimere dati in modo efficiente sia una forma di intelligenza generale. Questa idea si basa sulla nozione che comprendere il mondo circostante, spesso comporta l'identificazione di modelli e la comprensione della complessità, in un processo simile a ciò che una buona compressione dati fa.

Comprimere un grande insieme di dati in una forma più compatta, mantenendo però le informazioni essenziali, rappresenta una sorta di comprensione, o rappresentazione, dei dati stessi.

Il Premio Hutter, intitolato a Marcus Hutter, uno dei ricercatori di IA e autore dell'articolo di DeepMind, mette in evidenza questa idea. Il premio è assegnato a chi riesce a comprimere in modo estremamente efficiente un insieme fisso di testo in lingua inglese.

La premessa alla base di questo premio è che una compressione altamente efficiente del testo richieda una profonda comprensione dei modelli semantici e sintattici del linguaggio, simile a come li comprende un essere umano.

In sintesi, la ricerca di DeepMind evidenzia un'affascinante connessione tra la capacità di previsione e la compressione dei dati. Anche se il paper non è ancora stato sottoposto a revisione paritaria, suggerisce che i modelli di linguaggio IA potrebbero avere un ruolo importante nella compressione di dati in vari formati.

Fonte dell'articolo: arstechnica.com

Le notizie più lette

#1
Un'iPhone dotato di internet satellitare? Si ma tramite una cover

Smartphone

Un'iPhone dotato di internet satellitare? Si ma tramite una cover

#2
Possibile svolta per il quantum computing

Scienze

Possibile svolta per il quantum computing

#3
Le gare estreme accelerano l’invecchiamento del sangue

Scienze

Le gare estreme accelerano l’invecchiamento del sangue

#4
NASA: Hubble individua galassia quasi invisibile

Scienze

NASA: Hubble individua galassia quasi invisibile

#5
Ricerca medica, l’AI riduce i tempi di studio

Scienze

Ricerca medica, l’AI riduce i tempi di studio

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

EMP ti veste come un Pokémon! Collezione a tema ora in mega sconto!

Altri temi

EMP ti veste come un Pokémon! Collezione a tema ora in mega sconto!

Di Dario De Vita
Il vero affare del weekend? -15% extra dall’app MediaWorld

Altri temi

Il vero affare del weekend? -15% extra dall’app MediaWorld

Di Dario De Vita
Recensione Tapo RV50 Pro Omni, automazione senza compromessi

Altri temi

Recensione Tapo RV50 Pro Omni, automazione senza compromessi

Di Andrea Ferrario
4 aspirapolvere e lavapavimenti che, a questi prezzi, conviene prendere su AliExpress

Altri temi

4 aspirapolvere e lavapavimenti che, a questi prezzi, conviene prendere su AliExpress

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.