image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Questo TV OLED 4K Samsung è un VERO AFFARE a questo prezzo! Questo TV OLED 4K Samsung è un VERO AFFARE a questo prezzo!...
Immagine di Narwal Freo Z10: quasi come la versione Ultra, ma costa meno | Test & Recensione Narwal Freo Z10: quasi come la versione Ultra, ma costa meno...

Meta ha piratato migliaia di libri, e non vuole pagare un centesimo

Meta ha ammesso di utilizzare il noto dataset "pirata" Books3, ma mostra riluttanza nel compensare adeguatamente gli scrittori.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Giulia Serena

a cura di Giulia Serena

Editor

Pubblicato il 15/01/2024 alle 10:09

L'utilizzo di materiale proprietario nell'addestramento di modelli AI avanzati è diventato una questione controversa, portando molte aziende a dover affrontare sfide legali da parte di autori e organizzazioni media (l'altro giorno vi abbiamo parlato della questione per quanto riguarda OpenAI e il suo ChatGPT). Ebbene, di recente Meta ha ammesso di utilizzare il noto dataset "pirata" Books3, ma mostra riluttanza nel compensare adeguatamente gli scrittori.

Un gruppo di autori ha intentato una causa legale contro l'azienda, accusando l'uso illecito di materiale coperto da copyright nello sviluppo dei suoi modelli linguistici di grandi dimensioni, Llama 1 e Llama 2. In risposta, Facebook ha ammesso che i suoi modelli LLM sono stati addestrati utilizzando libri coperti da copyright.

Meta ha, infatti, confermato l'utilizzo del dataset Books3, tra molti altri materiali, per addestrare i modelli Llama 1 e Llama 2. Books3 è un set ben noto che include una vasta collezione di oltre 195.000 libri in formato testo, con una dimensione totale di quasi 37 GB. Creato nel 2020 dal ricercatore di intelligenza artificiale Shawn Presser, l'archivio mirava a fornire una migliore fonte di dati per migliorare gli algoritmi di apprendimento automatico.

L'ampia disponibilità del dataset Books3 ha portato al suo diffuso utilizzo nell'addestramento AI da parte di numerosi ricercatori. Grandi aziende tecnologiche, inclusa Meta, hanno sfruttato Books3 e altri dataset controversi per i propri prodotti AI commerciali.

Nonostante l'ammissione dell'uso di parti del dataset Books3, Meta sostiene che l'utilizzo di opere coperte da copyright per addestrare i modelli LLM non richieda "consenso, riconoscimento o compensazione". L'azienda contesta le accuse di violazione del copyright, sostenendo che eventuali copie non autorizzate di opere coperte da copyright in Books3 dovrebbero essere considerate uso lecito.

Inoltre, Meta contesta la validità della causa legale come una class action, rifiutandosi di fornire qualsiasi "relief" monetario agli autori che citano in giudizio o a coloro coinvolti nella controversia su Books3. Nel 2023, il dataset, che include materiale coperto da copyright proveniente dal sito pirata Bibliotik, è stato oggetto di attenzione da parte del gruppo danese anti-pirateria Rights Alliance, che ha richiesto il divieto dell'archiviazione digitale del dataset Books3 utilizzando avvisi DMCA per imporre tali rimozioni.

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    No ufficio, no sviluppatori: il paradigma che cambia il lavoro tech
  • #2
    Un bug di un aggiornamento di Windows 11 sta causando dei problemi
  • #3
    Lotta alla pirateria digitale: i risultati ci sono, ma a quale prezzo?
  • #4
    Ora sappiamo come si chiamerà il seguito di Cyberpunk 2077
  • #5
    Anche il browser sarà in abbonamento: tutta colpa dell'IA
  • #6
    Compra una RTX 5090 ma ci trova dentro tre zaini
Articolo 1 di 5
Narwal Freo Z10: quasi come la versione Ultra, ma costa meno | Test & Recensione
Un robot aspirapolvere e lavapavimenti efficiente, che pulisce bene e richiede poca manutenzione, venduto a un prezzo molto competitivo.
Immagine di Narwal Freo Z10: quasi come la versione Ultra, ma costa meno | Test & Recensione
Leggi questo articolo
Articolo 2 di 5
Questo TV OLED 4K Samsung è un VERO AFFARE a questo prezzo!
Approfitta dello sconto esclusivo su MediaWorld per il Samsung QE55S90DAEXZT e porta a casa un TV OLED 4K di alta gamma.
Immagine di Questo TV OLED 4K Samsung è un VERO AFFARE a questo prezzo!
Leggi questo articolo
Articolo 3 di 5
Completa l'acquisto via APP e la LG OLED C4 è tua a 824€
È il momento di cambiare TV? Con questa offerta Mediaworld, potete mettere da parte ogni dubbio, poiché c'è la LG OLED evo C4 da 55" a soli 824€.
Immagine di Completa l'acquisto via APP e la LG OLED C4 è tua a 824€
Leggi questo articolo
Articolo 4 di 5
Dreame L40 Ultra: il robot che cambierà il tuo modo di pulire è in SCONTO!
Dreame L40 Ultra combina aspirazione potente e lavaggio efficace, garantendo una pulizia profonda su ogni superficie. Approfitta dell'offerta!
Immagine di Dreame L40 Ultra: il robot che cambierà il tuo modo di pulire è in SCONTO!
Leggi questo articolo
Articolo 5 di 5
Echo Show 5: il tuo nuovo assistente smart è in OFFERTA a MENO DI 70€!
Scopri come l'Echo Show 5 può rivoluzionare la tua casa con controllo vocale e videochiamate, ora con uno sconto del 36%.
Immagine di Echo Show 5: il tuo nuovo assistente smart è in OFFERTA a MENO DI 70€!
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.