image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte di Natale
Accedi a Xenforo
Immagine di Cloudflare sfida l’AI: stop a 416 miliardi di richieste bot Cloudflare sfida l’AI: stop a 416 miliardi di richieste bo...
Immagine di AMD Ryzen 9850X3D: spuntano i primi, sorprendenti benchmark AMD Ryzen 9850X3D: spuntano i primi, sorprendenti benchmark...

DeepSeek-OCR cambia le regole dell’intelligenza artificiale

DeepSeek-OCR rivoluziona l’elaborazione dei documenti convertendo il testo in immagini, riducendo i costi e i consumi computazionali.

Advertisement

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor @Tom's Hardware Italia

Pubblicato il 21/10/2025 alle 16:10

La notizia in un minuto

  • DeepSeek-OCR trasforma il testo in immagini prima di processarlo, riducendo il consumo di token da 7 a 20 volte rispetto ai metodi tradizionali
  • Con compressione inferiore a 10 volte mantiene un'accuratezza del 97%, ma scende al 60% con compressione massima, rivelando i limiti attuali della tecnologia
  • Applicazioni promettenti in finanza, medicina e ricerca scientifica per l'analisi di tabelle, grafici e grandi volumi di dati strutturati con minimo dispendio computazionale

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'intelligenza artificiale cinese DeepSeek continua a sorprendere con innovazioni che puntano dritto al cuore di uno dei problemi più costosi del settore: l'elaborazione di grandi quantità di dati testuali. Dopo aver fatto scalpore all'inizio del 2025 dimostrando capacità simili a ChatGPT e Google Gemini ma con costi di sviluppo drasticamente inferiori, gli sviluppatori cinesi hanno presentato DeepSeek-OCR, un modello che ribalta il tradizionale approccio all'analisi dei documenti. La soluzione? Trasformare il testo in immagini prima di processarlo, una scelta apparentemente controintuitiva che sta già facendo discutere esperti e addetti ai lavori.

Il funzionamento di questa tecnologia si basa su un principio elegante nella sua semplicità: utilizzare codificatori di visione per convertire documenti complessi e lunghi blocchi di testo in formato immagine. Quando l'AI deve successivamente accedere a queste informazioni, il consumo di token risulta ridotto da sette fino a venti volte rispetto ai metodi tradizionali. Secondo quanto riportato da SCMP, questa riduzione non compromette significativamente la precisione del sistema, aprendo scenari inediti per l'efficienza computazionale.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

I campi di applicazione dove questa tecnologia potrebbe rivelarsi particolarmente preziosa sono quelli che gestiscono grandi volumi di dati strutturati: finanza, medicina e ricerca scientifica. La capacità di DeepSeek-OCR di interpretare tabelle, grafici e rappresentazioni visali complesse con un minimo dispendio di risorse computazionali potrebbe rivoluzionare l'analisi di bilanci, cartelle cliniche o dataset scientifici. Gli sviluppatori sottolineano come questa compressione visione-testo offra "una direzione promettente" per gestire calcoli che richiedono contesti estremamente lunghi.

La conversione in immagini riduce i token fino a venti volte

I test di benchmark condotti dagli sviluppatori rivelano dati interessanti sulle prestazioni effettive del sistema. Con una compressione inferiore al fattore 10, DeepSeek-OCR mantiene un impressionante 97% di accuratezza nella decodifica delle informazioni. Quando però si spinge l'acceleratore al massimo con una compressione di 20 volte, la precisione scende drasticamente al 60%, evidenziando i limiti attuali della tecnologia. Anche una modesta riduzione del consumo di token del doppio, mantenendo un'accuratezza vicina al 100%, potrebbe tuttavia rappresentare un cambio di paradigma nel costo operativo dei modelli AI più avanzati.

Gli sviluppatori stanno inoltre esplorando l'utilizzo di questo approccio per generare dati di addestramento per modelli futuri. Questa prospettiva solleva però interrogativi legittimi: introdurre anche solo qualche punto percentuale di errore in fase di training potrebbe compromettere l'affidabilità dei sistemi che ne derivano. La comunità scientifica osserva con interesse ma anche con cautela questa possibile applicazione.

Per chi volesse sperimentare direttamente con DeepSeek-OCR, il modello è già disponibile sulle piattaforme di sviluppo Hugging Face e GitHub. Questa scelta di rendere pubblicamente accessibile la tecnologia riflette la strategia degli sviluppatori cinesi di costruire un ecosistema aperto attorno alle loro innovazioni, contrastando l'approccio più chiuso di alcuni competitor occidentali.

Fonte dell'articolo: www.tomshardware.com

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Avatar di Ospite Java Runner #379 0
Java Runner
0
Deep is the best
Segnala 1 mese fa
Questo commento è stato nascosto automaticamente.

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

AMD Ryzen 9850X3D: spuntano i primi, sorprendenti benchmark

Hardware

AMD Ryzen 9850X3D: spuntano i primi, sorprendenti benchmark

Di Andrea Maiellano
Cloudflare sfida l’AI: stop a 416 miliardi di richieste bot
1

Hardware

Cloudflare sfida l’AI: stop a 416 miliardi di richieste bot

Di Antonello Buzzi
UE, multa record a X: primo stop del Digital Services Act
1

Hardware

UE, multa record a X: primo stop del Digital Services Act

Di Antonello Buzzi
Apple perde altri due dirigenti di alto livello
1

Hardware

Apple perde altri due dirigenti di alto livello

Di Antonello Buzzi
Riparare una RTX 5090 costa più che comprarla nuova
3

Hardware

Riparare una RTX 5090 costa più che comprarla nuova

Di Andrea Maiellano

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.