L'intelligenza artificiale generativa si trova sempre più spesso al centro di controversie legate alle pratiche di raccolta dati dal web, e il caso di Perplexity rappresenta uno degli esempi più emblematici di questa tendenza. L'azienda, che sviluppa un motore di ricerca basato su AI, è finita nuovamente sotto i riflettori per le sue metodologie di web scraping, pratiche che secondo un nuovo rapporto di Cloudflare sarebbero non solo continuate, ma addirittura intensificate nonostante le precedenti polemiche. La questione assume particolare rilevanza considerando che Apple starebbe valutando l'acquisizione della società, sollevando interrogativi sulla compatibilità tra queste pratiche controverse e i principi etici storicamente sostenuti dalla casa di Cupertino.
Le accuse di Cloudflare: un sistema organizzato per aggirare i blocchi
Il rapporto pubblicato da Cloudflare dipinge un quadro preoccupante delle attività di Perplexity nel panorama del web crawling. Secondo l'analisi tecnica condotta dalla società di sicurezza informatica, Perplexity non si limiterebbe a utilizzare i propri crawler dichiarati, ma ricorrerebbe anche a user-agent generici progettati per imitare il browser Google Chrome su macOS quando i suoi crawler ufficiali vengono bloccati.
La sofisticazione del sistema descritto da Cloudflare è notevole: l'azienda avrebbe implementato una rotazione di indirizzi IP non elencati nel range ufficiale di Perplexity, utilizzando diversi ASN (Autonomous System Numbers) per eludere i blocchi implementati dai siti web. Questa attività interesserebbe decine di migliaia di domini con milioni di richieste giornaliere, configurandosi come una vera e propria operazione sistematica di elusione delle protezioni.
La difesa semantica di Perplexity e le controversie precedenti
Le polemiche attorno alle pratiche di web crawling di Perplexity non sono una novità. Già nel giugno 2024, pubblicazioni come Wired avevano accusato l'azienda di ignorare il Robots Exclusion Protocol, il protocollo standard che regola l'accesso automatizzato ai contenuti web. All'epoca, il CEO Aravind Srinivas aveva attribuito la responsabilità a un fornitore terzo non identificato, parlando di "incomprensione di base" dei meccanismi coinvolti.
La strategia difensiva di Perplexity si è concentrata principalmente su distinzioni semantiche tra crawling e scraping. Secondo l'azienda, quando un utente fornisce manualmente un URL all'AI, il sistema non agirebbe come web crawler ma come strumento di assistenza per recuperare informazioni richieste dall'utente stesso. Tuttavia, questa distinzione appare poco convincente agli occhi degli editori, considerando che l'accesso e l'elaborazione di URL per migliaia di volte al giorno mantiene le caratteristiche sostanziali dello scraping automatizzato.
Le tensioni si sono ulteriormente intensificate quando testate come The New York Times e BBC hanno minacciato azioni legali, ricevendo da Perplexity risposte particolarmente dure. L'azienda ha definito la BBC "manipolatoria e opportunista", accusandola di avere una "comprensione fondamentalmente errata della tecnologia, di internet e del diritto della proprietà intellettuale".
Il dilemma Apple: acquisire o mantenere i principi?
La questione assume dimensioni ancora più complesse considerando i rumor persistenti su un possibile interesse di Apple nell'acquisire Perplexity. Da un lato, l'acquisizione rappresenterebbe per Apple un'opportunità strategica per colmare il gap nell'intelligenza artificiale rispetto ai concorrenti. Dall'altro, solleva interrogativi fondamentali sulla compatibilità tra le pratiche controverse di Perplexity e l'immagine di azienda attenta alla privacy e all'etica che Apple ha costruito negli anni.
La posizione di Apple risulta particolarmente delicata. L'azienda potrebbe teoricamente credere di poter "ripulire" le tecnologie acquisite attraverso la propria cultura aziendale e le proprie pratiche etiche di web crawling. Tuttavia, questo approccio non cancellerebbe il fatto che Perplexity ha raggiunto la sua posizione attuale proprio grazie alle metodologie ora sotto accusa.
L'eventuale acquisizione metterebbe Apple di fronte a un bivio etico significativo. Se da una parte la due diligence aziendale dovrebbe garantire l'assenza di compromissioni legali, dall'altra potrebbe segnalare una disponibilità della casa di Cupertino a scendere a compromessi sui propri principi fondamentali pur di recuperare terreno nel settore dell'AI. Una simile eventualità rappresenterebbe, secondo molti osservatori, una delusione ancora maggiore rispetto all'attuale ritardo tecnologico di Apple nel campo dell'intelligenza artificiale generativa.