image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte di Natale
Accedi a Xenforo
Immagine di Solo 3 giorni: MediaWorld elimina il 15% sui prezzi già scontati Solo 3 giorni: MediaWorld elimina il 15% sui prezzi già sco...
Immagine di Dove vedere Milan - Sassuolo in TV e streaming Dove vedere Milan - Sassuolo in TV e streaming...

Meta ha piratato migliaia di libri, e non vuole pagare un centesimo

Meta ha ammesso di utilizzare il noto dataset "pirata" Books3, ma mostra riluttanza nel compensare adeguatamente gli scrittori.

Advertisement

Avatar di Giulia Serena

a cura di Giulia Serena

Editor @Tom's Hardware Italia

Pubblicato il 15/01/2024 alle 10:09
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'utilizzo di materiale proprietario nell'addestramento di modelli AI avanzati è diventato una questione controversa, portando molte aziende a dover affrontare sfide legali da parte di autori e organizzazioni media (l'altro giorno vi abbiamo parlato della questione per quanto riguarda OpenAI e il suo ChatGPT). Ebbene, di recente Meta ha ammesso di utilizzare il noto dataset "pirata" Books3, ma mostra riluttanza nel compensare adeguatamente gli scrittori.

Un gruppo di autori ha intentato una causa legale contro l'azienda, accusando l'uso illecito di materiale coperto da copyright nello sviluppo dei suoi modelli linguistici di grandi dimensioni, Llama 1 e Llama 2. In risposta, Facebook ha ammesso che i suoi modelli LLM sono stati addestrati utilizzando libri coperti da copyright.

Meta ha, infatti, confermato l'utilizzo del dataset Books3, tra molti altri materiali, per addestrare i modelli Llama 1 e Llama 2. Books3 è un set ben noto che include una vasta collezione di oltre 195.000 libri in formato testo, con una dimensione totale di quasi 37 GB. Creato nel 2020 dal ricercatore di intelligenza artificiale Shawn Presser, l'archivio mirava a fornire una migliore fonte di dati per migliorare gli algoritmi di apprendimento automatico.

L'ampia disponibilità del dataset Books3 ha portato al suo diffuso utilizzo nell'addestramento AI da parte di numerosi ricercatori. Grandi aziende tecnologiche, inclusa Meta, hanno sfruttato Books3 e altri dataset controversi per i propri prodotti AI commerciali.

Nonostante l'ammissione dell'uso di parti del dataset Books3, Meta sostiene che l'utilizzo di opere coperte da copyright per addestrare i modelli LLM non richieda "consenso, riconoscimento o compensazione". L'azienda contesta le accuse di violazione del copyright, sostenendo che eventuali copie non autorizzate di opere coperte da copyright in Books3 dovrebbero essere considerate uso lecito.

Inoltre, Meta contesta la validità della causa legale come una class action, rifiutandosi di fornire qualsiasi "relief" monetario agli autori che citano in giudizio o a coloro coinvolti nella controversia su Books3. Nel 2023, il dataset, che include materiale coperto da copyright proveniente dal sito pirata Bibliotik, è stato oggetto di attenzione da parte del gruppo danese anti-pirateria Rights Alliance, che ha richiesto il divieto dell'archiviazione digitale del dataset Books3 utilizzando avvisi DMCA per imporre tali rimozioni.

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Dove vedere Milan - Sassuolo in TV e streaming

Altri temi

Dove vedere Milan - Sassuolo in TV e streaming

Di Dario De Vita
Solo 3 giorni: MediaWorld elimina il 15% sui prezzi già scontati

Altri temi

Solo 3 giorni: MediaWorld elimina il 15% sui prezzi già scontati

Di Dario De Vita
Dove vedere Udinese - Napoli in TV e streaming

Altri temi

Dove vedere Udinese - Napoli in TV e streaming

Di Dario De Vita
Dove vedere Genoa - Inter in TV e streaming

Altri temi

Dove vedere Genoa - Inter in TV e streaming

Di Dario De Vita
Dove vedere Bologna - Juventus in TV e streaming

Altri temi

Dove vedere Bologna - Juventus in TV e streaming

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.