image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Google conferma l’uso malevolo di Gemini AI Google conferma l’uso malevolo di Gemini AI...
Immagine di SMIC avverte: i data center AI rischiano di restare vuoti SMIC avverte: i data center AI rischiano di restare vuoti...

DeepSeek-OCR cambia le regole dell’intelligenza artificiale

DeepSeek-OCR rivoluziona l’elaborazione dei documenti convertendo il testo in immagini, riducendo i costi e i consumi computazionali.

Advertisement

Avatar di Antonello Buzzi

a cura di Antonello Buzzi

Senior Editor @Tom's Hardware Italia

Pubblicato il 21/10/2025 alle 16:10

La notizia in un minuto

  • DeepSeek-OCR trasforma il testo in immagini prima di processarlo, riducendo il consumo di token da 7 a 20 volte rispetto ai metodi tradizionali
  • Con compressione inferiore a 10 volte mantiene un'accuratezza del 97%, ma scende al 60% con compressione massima, rivelando i limiti attuali della tecnologia
  • Applicazioni promettenti in finanza, medicina e ricerca scientifica per l'analisi di tabelle, grafici e grandi volumi di dati strutturati con minimo dispendio computazionale

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'intelligenza artificiale cinese DeepSeek continua a sorprendere con innovazioni che puntano dritto al cuore di uno dei problemi più costosi del settore: l'elaborazione di grandi quantità di dati testuali. Dopo aver fatto scalpore all'inizio del 2025 dimostrando capacità simili a ChatGPT e Google Gemini ma con costi di sviluppo drasticamente inferiori, gli sviluppatori cinesi hanno presentato DeepSeek-OCR, un modello che ribalta il tradizionale approccio all'analisi dei documenti. La soluzione? Trasformare il testo in immagini prima di processarlo, una scelta apparentemente controintuitiva che sta già facendo discutere esperti e addetti ai lavori.

Il funzionamento di questa tecnologia si basa su un principio elegante nella sua semplicità: utilizzare codificatori di visione per convertire documenti complessi e lunghi blocchi di testo in formato immagine. Quando l'AI deve successivamente accedere a queste informazioni, il consumo di token risulta ridotto da sette fino a venti volte rispetto ai metodi tradizionali. Secondo quanto riportato da SCMP, questa riduzione non compromette significativamente la precisione del sistema, aprendo scenari inediti per l'efficienza computazionale.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

I campi di applicazione dove questa tecnologia potrebbe rivelarsi particolarmente preziosa sono quelli che gestiscono grandi volumi di dati strutturati: finanza, medicina e ricerca scientifica. La capacità di DeepSeek-OCR di interpretare tabelle, grafici e rappresentazioni visali complesse con un minimo dispendio di risorse computazionali potrebbe rivoluzionare l'analisi di bilanci, cartelle cliniche o dataset scientifici. Gli sviluppatori sottolineano come questa compressione visione-testo offra "una direzione promettente" per gestire calcoli che richiedono contesti estremamente lunghi.

La conversione in immagini riduce i token fino a venti volte

I test di benchmark condotti dagli sviluppatori rivelano dati interessanti sulle prestazioni effettive del sistema. Con una compressione inferiore al fattore 10, DeepSeek-OCR mantiene un impressionante 97% di accuratezza nella decodifica delle informazioni. Quando però si spinge l'acceleratore al massimo con una compressione di 20 volte, la precisione scende drasticamente al 60%, evidenziando i limiti attuali della tecnologia. Anche una modesta riduzione del consumo di token del doppio, mantenendo un'accuratezza vicina al 100%, potrebbe tuttavia rappresentare un cambio di paradigma nel costo operativo dei modelli AI più avanzati.

Gli sviluppatori stanno inoltre esplorando l'utilizzo di questo approccio per generare dati di addestramento per modelli futuri. Questa prospettiva solleva però interrogativi legittimi: introdurre anche solo qualche punto percentuale di errore in fase di training potrebbe compromettere l'affidabilità dei sistemi che ne derivano. La comunità scientifica osserva con interesse ma anche con cautela questa possibile applicazione.

Per chi volesse sperimentare direttamente con DeepSeek-OCR, il modello è già disponibile sulle piattaforme di sviluppo Hugging Face e GitHub. Questa scelta di rendere pubblicamente accessibile la tecnologia riflette la strategia degli sviluppatori cinesi di costruire un ecosistema aperto attorno alle loro innovazioni, contrastando l'approccio più chiuso di alcuni competitor occidentali.

Fonte dell'articolo: www.tomshardware.com

Le notizie più lette

#1
Giocare non ci piace più, preferiamo comprare a caso

Editoriale

Giocare non ci piace più, preferiamo comprare a caso

#2
SMIC avverte: i data center AI rischiano di restare vuoti
6

Hardware

SMIC avverte: i data center AI rischiano di restare vuoti

#3
Google conferma l’uso malevolo di Gemini AI

Hardware

Google conferma l’uso malevolo di Gemini AI

#4
La vita potrebbe essere nata da gel aderenti alle rocce

Scienze

La vita potrebbe essere nata da gel aderenti alle rocce

#5
Xbox Game Pass si arricchisce oggi di tre giochi gratis
2

Videogioco

Xbox Game Pass si arricchisce oggi di tre giochi gratis

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Avatar di Ospite Java Runner #379 0
Java Runner
0
Deep is the best
Segnala 3 mesi fa
Questo commento è stato nascosto automaticamente.

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

SMIC avverte: i data center AI rischiano di restare vuoti
6

Hardware

SMIC avverte: i data center AI rischiano di restare vuoti

Di Antonello Buzzi
Google conferma l’uso malevolo di Gemini AI

Hardware

Google conferma l’uso malevolo di Gemini AI

Di Antonello Buzzi
Claude amplia il piano gratis con app e file Office
1

Hardware

Claude amplia il piano gratis con app e file Office

Di Antonello Buzzi
Chip, gli USA legano i dazi agli investimenti di TSMC
2

Hardware

Chip, gli USA legano i dazi agli investimenti di TSMC

Di Antonello Buzzi
Dimentica gli 8GB! Questa RX 9060 XT è un affare a questo prezzo
1

Offerte e Sconti

Dimentica gli 8GB! Questa RX 9060 XT è un affare a questo prezzo

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.