image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di ChatGPT ora mostra pubblicità particolarmente invadenti ChatGPT ora mostra pubblicità particolarmente invadenti...
Immagine di ExFAT su Linux: un driver ne incrementa notevolmente la velocità ExFAT su Linux: un driver ne incrementa notevolmente la velo...

Anthropic accusata di violare le regole anti-bot

Anthropic sotto accusa: iFixit e Freelancer contestano la violazione del protocollo "do not crawl" nell'addestramento dei modelli linguistici Claude.

Advertisement

Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author @Tom's Hardware Italia

Pubblicato il 28/07/2024 alle 11:00
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'azienda di intelligenza artificiale Anthropic, creatrice del modello linguistico Claude, è stata accusata di ignorare i protocolli "do not crawl" presenti nei file robots.txt di diversi siti web.

Questa pratica avrebbe permesso all'azienda di raccogliere dati in modo aggressivo, causando svariati problemi ai proprietari dei siti colpiti.

Anthropic non è l'unica azienda AI accusata di ignorare i protocolli robots.txt.

Matt Barrie, CEO di Freelancer, ha dichiarato che il bot di Anthropic è "di gran lunga il crawler più aggressivo". Secondo Barrie, il sito di Freelancer avrebbe ricevuto 3,5 milioni di visite dal crawler di Anthropic in sole quattro ore, un volume circa cinque volte superiore rispetto al secondo crawler AI più attivo.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

Analogamente, Kyle Wiens, CEO di iFixit, ha segnalato che il bot di Anthropic ha effettuato un milione di accessi ai server di iFixit nell'arco di 24 ore. "Non solo state prendendo i nostri contenuti senza pagare, ma state anche occupando le nostre risorse DevOps", ha commentato Wiens.

Il file robots.txt contiene istruzioni per i web crawler su quali pagine possono o non possono accedere. Sebbene il rispetto di queste regole sia volontario, tradizionalmente veniva osservato dalla maggior parte dei bot legittimi.

Immagine id 29540

Barrie ha riferito che Freelancer ha inizialmente tentato di rifiutare le richieste di accesso del bot, ma alla fine ha dovuto bloccare completamente il crawler di Anthropic. "Questo scraping eccessivo rallenta il sito per tutti gli utenti e alla fine influisce sui nostri ricavi", ha aggiunto.

Per quanto riguarda iFixit, Wiens ha dichiarato che il sito ha impostato allarmi per il traffico elevato e che il suo team è stato svegliato alle 3 del mattino a causa delle attività di Anthropic. Il crawler dell'azienda ha smesso di raccogliere dati da iFixit solo dopo l'aggiunta di una riga specifica nel file robots.txt che ne vieta l'accesso.

Anthropic ha dichiarato di rispettare i file robots.txt e che il suo crawler "ha rispettato quel segnale quando iFixit lo ha implementato". L'azienda ha anche affermato di mirare a "una minima interruzione essendo attenta alla velocità con cui esegue il crawling degli stessi domini" e sta attualmente indagando sul caso.

Le aziende di AI utilizzano i crawler per raccogliere contenuti dai siti web da utilizzare per addestrare le loro tecnologie di AI generativa. Questa pratica ha portato a diverse cause legali, con editori che accusano le aziende di AI di violazione del copyright.

Per prevenire ulteriori azioni legali, alcune aziende come OpenAI stanno stipulando accordi con editori e siti web. Wiens di iFixit sembra aperto all'idea di firmare un accordo per l'utilizzo dei contenuti del sito, invitando Anthropic a discutere di una possibile licenza per uso commerciale.

Fonte dell'articolo: www.engadget.com

Le notizie più lette

#1
ChatGPT ora mostra pubblicità particolarmente invadenti
6

Hardware

ChatGPT ora mostra pubblicità particolarmente invadenti

#2
Addio ai "giri di ruota" su Fortnite! Epic ferma di nuovo tutto

Videogioco

Addio ai "giri di ruota" su Fortnite! Epic ferma di nuovo tutto

#3
Regolamentazione europea: ostacolo o opportunità?

Business

Regolamentazione europea: ostacolo o opportunità?

#4
ExFAT su Linux: un driver ne incrementa notevolmente la velocità

Hardware

ExFAT su Linux: un driver ne incrementa notevolmente la velocità

#5
iPhone 18 Pro e Fold messi a nudo dai leak, ecco tutto quello che sappiamo
4

Smartphone

iPhone 18 Pro e Fold messi a nudo dai leak, ecco tutto quello che sappiamo

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

ExFAT su Linux: un driver ne incrementa notevolmente la velocità

Hardware

ExFAT su Linux: un driver ne incrementa notevolmente la velocità

Di Andrea Maiellano
ChatGPT ora mostra pubblicità particolarmente invadenti

Hardware

ChatGPT ora mostra pubblicità particolarmente invadenti

Di Andrea Maiellano
Migliori chiavette USB (gennaio 2026)

GUIDA ALL'ACQUISTO

Migliori chiavette USB (gennaio 2026)

Di Antonello Buzzi, David Bossi

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.