image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Recensione SwitchBot Safety Alarm, allarme personale e localizzatore Recensione SwitchBot Safety Alarm, allarme personale e local...
Immagine di Questa TV sfida TCL sul rapporto qualità/prezzo, e potrebbe vincere Questa TV sfida TCL sul rapporto qualità/prezzo, e potrebbe...

Reddit fa causa a Perplexity per furto contenuti

Reddit fa causa a Perplexity: l'accusa è di aver aver raccolto i propri dati senza autorizzazione.

Advertisement

Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale @Tom's Hardware Italia

Pubblicato il 23/10/2025 alle 09:33

La notizia in un minuto

  • Reddit ha intentato una causa contro Perplexity e tre fornitori di web scraping, accusandoli di furto sistematico di dati attraverso l'elusione delle protezioni tecniche e l'utilizzo non autorizzato dei contenuti della piattaforma
  • Un esperimento investigativo condotto da Reddit ha dimostrato che contenuti esclusivi apparivano nelle risposte di Perplexity entro poche ore, rivelando l'estrazione dei dati tramite i risultati di ricerca di Google
  • La battaglia legale evidenzia il valore strategico dei contenuti umani di qualità per l'addestramento dell'IA e la tensione tra piattaforme che cercano compensi attraverso accordi di licenza e aziende che estraggono dati senza autorizzazione

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

La piattaforma di social news Reddit ha deciso di passare alle vie legali contro l'intelligenza artificiale di nuova generazione, accusando Perplexity e tre fornitori di servizi di web scraping di aver orchestrato quello che definisce un sistema di furto di dati su scala industriale. L'azione legale rappresenta un nuovo capitolo nella battaglia sempre più accesa tra le piattaforme che ospitano contenuti generati dagli utenti e le aziende di intelligenza artificiale affamate di materiale per addestrare i propri modelli. La causa civile mira a bloccare quelle che Reddit descrive come pratiche sistematiche di elusione delle protezioni tecnologiche implementate per salvaguardare i propri contenuti.

Secondo la documentazione depositata in tribunale, Reddit avrebbe già tentato la via diplomatica inviando una lettera di diffida a Perplexity nel maggio 2024, chiedendo esplicitamente di interrompere l'estrazione non autorizzata dei propri dati. La risposta dell'azienda di intelligenza artificiale fu rassicurante: Perplexity sostenne di non utilizzare i contenuti di Reddit per addestrare i propri modelli e promise di rispettare il file robots.txt, lo standard tecnico che indica ai bot quali pagine possono o non possono visitare. Tuttavia, secondo Reddit, i fatti raccontano una storia completamente diversa.

Per smascherare le presunte violazioni, Reddit ha condotto un esperimento investigativo creando un post accessibile esclusivamente ai crawler di Google. Nel giro di poche ore, quello stesso contenuto appariva nelle risposte generate da Perplexity. Questa evidenza costituisce, secondo l'azienda californiana, la prova inconfutabile che Perplexity o i suoi fornitori hanno estratto informazioni dalle pagine dei risultati di ricerca di Google per poi incorporarle rapidamente nel proprio motore di risposta basato sull'intelligenza artificiale.

La metafora utilizzata da Reddit per descrivere le società coinvolte è particolarmente evocativa: SerpApi, Oxylabs e AWMProxy vengono paragonate a rapinatori di banche che, incapaci di violare direttamente il caveau, decidono di assaltare il furgone blindato che trasporta il denaro. Questi intermediari tecnologici opererebbero mascherando le proprie identità, nascondendo la loro localizzazione geografica e camuffando i propri sistemi di estrazione automatica per aggirare le difese implementate dalle piattaforme.

I contenuti umani di qualità sono diventati l'oro nero dell'intelligenza artificiale

Ben Lee, responsabile legale di Reddit, ha dichiarato che le aziende di intelligenza artificiale sono coinvolte in una corsa agli armamenti per accaparrarsi contenuti umani di qualità, una pressione che ha alimentato un'economia del "riciclaggio di dati" su scala industriale. Reddit rappresenta un obiettivo particolarmente ambito perché custodisce una delle raccolte più vaste e dinamiche di conversazioni umane mai create, con discussioni su ogni argomento immaginabile, valutate e organizzate dagli stessi utenti attraverso il sistema di voto della piattaforma.

Il valore strategico di questi dati non è sfuggito a Reddit stessa, che ha trasformato l'accesso alle proprie API in un'opportunità commerciale. Le modifiche alle interfacce di programmazione introdotte nel 2023, che scatenarono proteste diffuse tra gli utenti e gli sviluppatori di applicazioni di terze parti, furono giustificate proprio dalla necessità di ottenere un compenso adeguato per l'utilizzo dei contenuti generati dalla comunità. L'azienda ha già stipulato accordi di licenza con OpenAI e Google, e secondo indiscrezioni starebbe cercando di negoziare termini ancora più vantaggiosi con altri potenziali partner.

Questa non è nemmeno la prima battaglia legale di Reddit nel campo dell'intelligenza artificiale: l'azienda aveva già intrapreso azioni contro Anthropic, accusando i bot della società di aver continuato ad accedere alla piattaforma nonostante le rassicurazioni contrarie. La strategia di Reddit sembra chiara: distinguere tra partner commerciali legittimi disposti a pagare per l'accesso ai dati e quelli che l'azienda considera "attori malevoli" che tentano di appropriarsi dei contenuti attraverso canali non autorizzati.

La difesa di Perplexity non si è fatta attendere. Jesse Dwyer, responsabile della comunicazione dell'azienda, pur dichiarando di non aver ancora ricevuto formalmente la documentazione della causa, ha annunciato l'intenzione di combattere vigorosamente per il diritto degli utenti di accedere liberamente e equamente alla conoscenza pubblica. Dwyer ha sottolineato che l'approccio dell'azienda rimane "basato su principi e responsabile" nella fornitura di risposte fattuali attraverso un'intelligenza artificiale accurata, aggiungendo che non tollererà minacce contro l'apertura e l'interesse pubblico.

Fonte dell'articolo: www.theverge.com

Le notizie più lette

#1
NordVPN vs ExpressVPN: qual è la migliore?
3

Hardware

NordVPN vs ExpressVPN: qual è la migliore?

#2
Una trasformazione proibita potrebbe riscrivere la fisica

Scienze

Una trasformazione proibita potrebbe riscrivere la fisica

#3
Microsoft fa qualcosa di utile per Windows, arriva Sysmon
1

Business

Microsoft fa qualcosa di utile per Windows, arriva Sysmon

#4
Netflix sul caso HBO Max: “Se costa troppo, via con un click”
3

Altri temi

Netflix sul caso HBO Max: “Se costa troppo, via con un click”

#5
La “cura miracolosa” funziona solo danneggiando le cellule
1

Scienze

La “cura miracolosa” funziona solo danneggiando le cellule

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Questa TV sfida TCL sul rapporto qualità/prezzo, e potrebbe vincere

Offerte e Sconti

Questa TV sfida TCL sul rapporto qualità/prezzo, e potrebbe vincere

Di Dario De Vita
Recensione SwitchBot Safety Alarm, allarme personale e localizzatore

Hardware

Recensione SwitchBot Safety Alarm, allarme personale e localizzatore

Di Andrea Ferrario
Problemi coi giochi PC? NVIDIA dice che è colpa di Windows

Hardware

Problemi coi giochi PC? NVIDIA dice che è colpa di Windows

Di Marco Pedrani
AMD punta sull'enterprise, i PC passano in secondo piano
3

Hardware

AMD punta sull'enterprise, i PC passano in secondo piano

Di Marco Pedrani
Combo Logitech: 2 periferiche con sconto del 58%!

Offerte e Sconti

Combo Logitech: 2 periferiche con sconto del 58%!

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.