image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Windows 11 risolve un bug che durava da una vita Windows 11 risolve un bug che durava da una vita...
Immagine di Huawei lancia nuovi PC con CPU e OS cinesi proprietari Huawei lancia nuovi PC con CPU e OS cinesi proprietari...

Reddit fa causa a Perplexity per furto contenuti

Reddit fa causa a Perplexity: l'accusa è di aver aver raccolto i propri dati senza autorizzazione.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale

Pubblicato il 23/10/2025 alle 09:33

La notizia in un minuto

  • Reddit ha intentato una causa contro Perplexity e tre fornitori di web scraping, accusandoli di furto sistematico di dati attraverso l'elusione delle protezioni tecniche e l'utilizzo non autorizzato dei contenuti della piattaforma
  • Un esperimento investigativo condotto da Reddit ha dimostrato che contenuti esclusivi apparivano nelle risposte di Perplexity entro poche ore, rivelando l'estrazione dei dati tramite i risultati di ricerca di Google
  • La battaglia legale evidenzia il valore strategico dei contenuti umani di qualità per l'addestramento dell'IA e la tensione tra piattaforme che cercano compensi attraverso accordi di licenza e aziende che estraggono dati senza autorizzazione
Riassunto generato con l'IA. Potrebbe non essere accurato.

La piattaforma di social news Reddit ha deciso di passare alle vie legali contro l'intelligenza artificiale di nuova generazione, accusando Perplexity e tre fornitori di servizi di web scraping di aver orchestrato quello che definisce un sistema di furto di dati su scala industriale. L'azione legale rappresenta un nuovo capitolo nella battaglia sempre più accesa tra le piattaforme che ospitano contenuti generati dagli utenti e le aziende di intelligenza artificiale affamate di materiale per addestrare i propri modelli. La causa civile mira a bloccare quelle che Reddit descrive come pratiche sistematiche di elusione delle protezioni tecnologiche implementate per salvaguardare i propri contenuti.

Secondo la documentazione depositata in tribunale, Reddit avrebbe già tentato la via diplomatica inviando una lettera di diffida a Perplexity nel maggio 2024, chiedendo esplicitamente di interrompere l'estrazione non autorizzata dei propri dati. La risposta dell'azienda di intelligenza artificiale fu rassicurante: Perplexity sostenne di non utilizzare i contenuti di Reddit per addestrare i propri modelli e promise di rispettare il file robots.txt, lo standard tecnico che indica ai bot quali pagine possono o non possono visitare. Tuttavia, secondo Reddit, i fatti raccontano una storia completamente diversa.

Per smascherare le presunte violazioni, Reddit ha condotto un esperimento investigativo creando un post accessibile esclusivamente ai crawler di Google. Nel giro di poche ore, quello stesso contenuto appariva nelle risposte generate da Perplexity. Questa evidenza costituisce, secondo l'azienda californiana, la prova inconfutabile che Perplexity o i suoi fornitori hanno estratto informazioni dalle pagine dei risultati di ricerca di Google per poi incorporarle rapidamente nel proprio motore di risposta basato sull'intelligenza artificiale.

La metafora utilizzata da Reddit per descrivere le società coinvolte è particolarmente evocativa: SerpApi, Oxylabs e AWMProxy vengono paragonate a rapinatori di banche che, incapaci di violare direttamente il caveau, decidono di assaltare il furgone blindato che trasporta il denaro. Questi intermediari tecnologici opererebbero mascherando le proprie identità, nascondendo la loro localizzazione geografica e camuffando i propri sistemi di estrazione automatica per aggirare le difese implementate dalle piattaforme.

I contenuti umani di qualità sono diventati l'oro nero dell'intelligenza artificiale

Ben Lee, responsabile legale di Reddit, ha dichiarato che le aziende di intelligenza artificiale sono coinvolte in una corsa agli armamenti per accaparrarsi contenuti umani di qualità, una pressione che ha alimentato un'economia del "riciclaggio di dati" su scala industriale. Reddit rappresenta un obiettivo particolarmente ambito perché custodisce una delle raccolte più vaste e dinamiche di conversazioni umane mai create, con discussioni su ogni argomento immaginabile, valutate e organizzate dagli stessi utenti attraverso il sistema di voto della piattaforma.

Il valore strategico di questi dati non è sfuggito a Reddit stessa, che ha trasformato l'accesso alle proprie API in un'opportunità commerciale. Le modifiche alle interfacce di programmazione introdotte nel 2023, che scatenarono proteste diffuse tra gli utenti e gli sviluppatori di applicazioni di terze parti, furono giustificate proprio dalla necessità di ottenere un compenso adeguato per l'utilizzo dei contenuti generati dalla comunità. L'azienda ha già stipulato accordi di licenza con OpenAI e Google, e secondo indiscrezioni starebbe cercando di negoziare termini ancora più vantaggiosi con altri potenziali partner.

Questa non è nemmeno la prima battaglia legale di Reddit nel campo dell'intelligenza artificiale: l'azienda aveva già intrapreso azioni contro Anthropic, accusando i bot della società di aver continuato ad accedere alla piattaforma nonostante le rassicurazioni contrarie. La strategia di Reddit sembra chiara: distinguere tra partner commerciali legittimi disposti a pagare per l'accesso ai dati e quelli che l'azienda considera "attori malevoli" che tentano di appropriarsi dei contenuti attraverso canali non autorizzati.

La difesa di Perplexity non si è fatta attendere. Jesse Dwyer, responsabile della comunicazione dell'azienda, pur dichiarando di non aver ancora ricevuto formalmente la documentazione della causa, ha annunciato l'intenzione di combattere vigorosamente per il diritto degli utenti di accedere liberamente e equamente alla conoscenza pubblica. Dwyer ha sottolineato che l'approccio dell'azienda rimane "basato su principi e responsabile" nella fornitura di risposte fattuali attraverso un'intelligenza artificiale accurata, aggiungendo che non tollererà minacce contro l'apertura e l'interesse pubblico.

Fonte dell'articolo: www.theverge.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Nascita e morte del CD: la tecnologia che ha cambiato tutto
  • #2
    Tornano le ricariche gratis per chi compra Tesla
  • #3
    Windows 7 “mini” da 69 MB: geniale o inutile?
  • #4
    Luminosità e contrasto: la "terza via" per un televisore ideale
  • #5
    Siri cambia anima: l’AI di Google arriva su iPhone
  • #6
    Intel rilancia: AVX e AMX tornano con Nova Lake
Articolo 1 di 5
Huawei lancia nuovi PC con CPU e OS cinesi proprietari
Huawei lancia due nuovi desktop con processore Kirin 9000X e sistema operativo Linux, abbandonando architetture x86 e Windows.
Immagine di Huawei lancia nuovi PC con CPU e OS cinesi proprietari
Leggi questo articolo
Articolo 2 di 5
Windows 11 risolve un bug che durava da una vita
Windows corregge finalmente un problema storico: cliccando "Aggiorna e arresta" il PC non si spegneva più, ma si riavviava dopo gli aggiornamenti.
Immagine di Windows 11 risolve un bug che durava da una vita
Leggi questo articolo
Articolo 3 di 5
ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
Un mini PC che racchiude prestazioni gaming di alto livello in appena 3 litri di volume, con processore Intel e GPU NVIDIA RTX 5080.
Immagine di ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
14
Leggi questo articolo
Articolo 4 di 5
Starlink e fibra ottica insieme per un’Italia senza zone bianche
FiberCop e Fmc Globalsat completano i test di una rete ibrida fibra-satellite per portare la banda ultralarga nelle zone non coperte dalla rete fissa.
Immagine di Starlink e fibra ottica insieme per un’Italia senza zone bianche
Leggi questo articolo
Articolo 5 di 5
MSI lancia una scheda madre per ambienti estremi
MSI presenta la scheda madre MS-CF16 V3.0 in formato Pico-ITX senza ventole, progettata per funzionare in ambienti estremi da -40°C a 70°C.
Immagine di MSI lancia una scheda madre per ambienti estremi
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.