image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Enel ti sorprende! Bonus fino a 200€ in bolletta solo con l’offerta online Enel ti sorprende! Bonus fino a 200€ in bolletta solo con ...
Immagine di Pesi indicativi + link Amazon delle uova Kinder One Piece e Harry Potter Pesi indicativi + link Amazon delle uova Kinder One Piece e ...

Meta ha piratato migliaia di libri, e non vuole pagare un centesimo

Meta ha ammesso di utilizzare il noto dataset "pirata" Books3, ma mostra riluttanza nel compensare adeguatamente gli scrittori.

Advertisement

Avatar di Giulia Serena

a cura di Giulia Serena

Editor @Tom's Hardware Italia

Pubblicato il 15/01/2024 alle 10:09
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'utilizzo di materiale proprietario nell'addestramento di modelli AI avanzati è diventato una questione controversa, portando molte aziende a dover affrontare sfide legali da parte di autori e organizzazioni media (l'altro giorno vi abbiamo parlato della questione per quanto riguarda OpenAI e il suo ChatGPT). Ebbene, di recente Meta ha ammesso di utilizzare il noto dataset "pirata" Books3, ma mostra riluttanza nel compensare adeguatamente gli scrittori.

Un gruppo di autori ha intentato una causa legale contro l'azienda, accusando l'uso illecito di materiale coperto da copyright nello sviluppo dei suoi modelli linguistici di grandi dimensioni, Llama 1 e Llama 2. In risposta, Facebook ha ammesso che i suoi modelli LLM sono stati addestrati utilizzando libri coperti da copyright.

Meta ha, infatti, confermato l'utilizzo del dataset Books3, tra molti altri materiali, per addestrare i modelli Llama 1 e Llama 2. Books3 è un set ben noto che include una vasta collezione di oltre 195.000 libri in formato testo, con una dimensione totale di quasi 37 GB. Creato nel 2020 dal ricercatore di intelligenza artificiale Shawn Presser, l'archivio mirava a fornire una migliore fonte di dati per migliorare gli algoritmi di apprendimento automatico.

L'ampia disponibilità del dataset Books3 ha portato al suo diffuso utilizzo nell'addestramento AI da parte di numerosi ricercatori. Grandi aziende tecnologiche, inclusa Meta, hanno sfruttato Books3 e altri dataset controversi per i propri prodotti AI commerciali.

Nonostante l'ammissione dell'uso di parti del dataset Books3, Meta sostiene che l'utilizzo di opere coperte da copyright per addestrare i modelli LLM non richieda "consenso, riconoscimento o compensazione". L'azienda contesta le accuse di violazione del copyright, sostenendo che eventuali copie non autorizzate di opere coperte da copyright in Books3 dovrebbero essere considerate uso lecito.

Inoltre, Meta contesta la validità della causa legale come una class action, rifiutandosi di fornire qualsiasi "relief" monetario agli autori che citano in giudizio o a coloro coinvolti nella controversia su Books3. Nel 2023, il dataset, che include materiale coperto da copyright proveniente dal sito pirata Bibliotik, è stato oggetto di attenzione da parte del gruppo danese anti-pirateria Rights Alliance, che ha richiesto il divieto dell'archiviazione digitale del dataset Books3 utilizzando avvisi DMCA per imporre tali rimozioni.

Le notizie più lette

#1
Addio ADSL: FTTH al 77%, ma pochi la attivano

Hardware

Addio ADSL: FTTH al 77%, ma pochi la attivano

#2
Recensione Avowed, il gioco di Obsidian arriva su PS5
4

Recensione

Recensione Avowed, il gioco di Obsidian arriva su PS5

#3
QR code con pixel da 49 nm segnano un nuovo record mondiale
1

Hardware

QR code con pixel da 49 nm segnano un nuovo record mondiale

#4
NotebookLM, Google interviene sul caos dei progetti
2

Hardware

NotebookLM, Google interviene sul caos dei progetti

#5
Google svela il Pixel 10a, democratizzazione dell’IA e fotocamera "Best-in-Class"

Smartphone

Google svela il Pixel 10a, democratizzazione dell’IA e fotocamera "Best-in-Class"

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Pesi indicativi + link Amazon delle uova Kinder One Piece e Harry Potter

Altri temi

Pesi indicativi + link Amazon delle uova Kinder One Piece e Harry Potter

Di Dario De Vita
Enel ti sorprende! Bonus fino a 200€ in bolletta solo con l’offerta online

Altri temi

Enel ti sorprende! Bonus fino a 200€ in bolletta solo con l’offerta online

Di Dario De Vita
ToxFree rileva sostanze pericolose nelle cuffie

Altri temi

ToxFree rileva sostanze pericolose nelle cuffie

Di Antonello Buzzi
Solo per i LEGO Days: -25% acquistando 2 set da Libraccio

Altri temi

Solo per i LEGO Days: -25% acquistando 2 set da Libraccio

Di Dario De Vita
Carnevale di offerte con LG: extra sconto e 200€ in regalo!

Altri temi

Carnevale di offerte con LG: extra sconto e 200€ in regalo!

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.