image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Editor's Choice
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di MacBook Neo batte M1 nei primi benchmark single-core MacBook Neo batte M1 nei primi benchmark single-core...
Immagine di Intel Core Ultra 5 250K, i primi benchmark spuntano online Intel Core Ultra 5 250K, i primi benchmark spuntano online...

DarkBERT è l'AI che decifra il linguaggio del dark web

Alcuni ricercatori hanno sviluppato un nuovo modello linguistico chiamato DarkBERT addestrato sui dati provenienti dal dark web.

Advertisement

Avatar di Luca Zaninello

a cura di Luca Zaninello

Managing Editor @Tom's Hardware Italia

Pubblicato il 18/05/2023 alle 10:05
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Il dark web è una parte nascosta di Internet a cui si può accedere solo attraverso un browser speciale come Tor. Viene spesso utilizzato per attività illegali come il traffico di droga, l'hacking e la criminalità informatica. Il dark web ha anche una cultura tutta propria e in esso viene utilizzato un linguaggio in codice che lo rendono di difficile comprensione per gli "estranei".

Per affrontare questa sfida, i ricercatori della Corea del Sud hanno sviluppato un nuovo modello linguistico chiamato DarkBERT addestrato sui dati provenienti dal dark web stesso.

DarkBERT si basa sull'architettura RoBERTa, un modello AI all'avanguardia in grado di elaborare grandi quantità di testo e generare risposte in linguaggio naturale. DarkBERT è in grado di analizzare un nuovo contenuto del dark web e di estrarne informazioni utili, come l'argomento, il sentiment e l'intento dell'autore.

DarkBERT è il risultato di un enorme processo di raccolta e filtraggio dei dati. I ricercatori hanno effettuato un crawling del dark web attraverso la rete Tor e hanno raccolto oltre 1,2 miliardi di parole di testo da varie fonti, come forum, blog, marketplace e chat room. Hanno poi applicato tecniche come la deduplicazione, il bilanciamento delle categorie e la pre-elaborazione dei dati per generare un database del dark web di alta qualità. Hanno utilizzato questo database per perfezionare il modello RoBERTa e creare DarkBERT.

I ricercatori hanno valutato DarkBERT su diversi compiti, come la classificazione del testo, l'analisi del sentiment, la modellazione degli argomenti e la risposta alle domande. Hanno confrontato DarkBERT con altri modelli linguistici di grandi dimensioni, come BERT, RoBERTa e ChatGPT. Hanno scoperto che DarkBERT ha superato tutti questi modelli nella maggior parte dei compiti, dimostrando di aver appreso le caratteristiche e i modelli specifici del linguaggio del dark web.

DarkBERT è uno strumento nuovo e potente per l'analisi del dark web. Può aiutare i ricercatori di sicurezza e le forze dell'ordine a monitorare e comprendere le attività e le tendenze del dark web. Può anche aiutare i ricercatori a studiare gli aspetti sociali e psicologici degli utenti e delle comunità del dark web.

Tuttavia, DarkBERT pone anche alcune sfide etiche e legali. Ad esempio, come possiamo garantire che DarkBERT non venga utilizzato per scopi dannosi, come la generazione di contenuti falsi o dannosi sul dark web? Come possiamo proteggere la privacy e l'anonimato degli utenti del dark web i cui dati sono stati utilizzati per addestrare DarkBERT? Come gestire le potenziali distorsioni e gli errori nei risultati di DarkBERT? Queste sono alcune delle domande che devono essere affrontate prima che DarkBERT possa essere adottato e diffuso su larga scala.

Fonte dell'articolo: www.tomshardware.com

Le notizie più lette

#1
iPhone 17e, i primi benchmark non sono da "iPhone economico"

Smartphone

iPhone 17e, i primi benchmark non sono da "iPhone economico"

#2
Intel Core Ultra 5 250K, i primi benchmark spuntano online
1

Hardware

Intel Core Ultra 5 250K, i primi benchmark spuntano online

#3
Questo smartphone appicca incendi e ricarica un MacBook Pro
2

Smartphone

Questo smartphone appicca incendi e ricarica un MacBook Pro

#4
MacBook Neo batte M1 nei primi benchmark single-core
3

Hardware

MacBook Neo batte M1 nei primi benchmark single-core

#5
Steam Machine, l'uscita nel 2026 è a rischio

Videogioco

Steam Machine, l'uscita nel 2026 è a rischio

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

I nuovi Mac desktop saranno più cari, ma il motivo non è quello che credete

Hardware

I nuovi Mac desktop saranno più cari, ma il motivo non è quello che credete

Di Andrea Maiellano
Intel Core Ultra 5 250K, i primi benchmark spuntano online
1

Hardware

Intel Core Ultra 5 250K, i primi benchmark spuntano online

Di Andrea Maiellano
MacBook Neo batte M1 nei primi benchmark single-core
3

Hardware

MacBook Neo batte M1 nei primi benchmark single-core

Di Andrea Maiellano
Panther Lake-H: ecco il die di Intel Core Ultra 3
3

Hardware

Panther Lake-H: ecco il die di Intel Core Ultra 3

Di Andrea Maiellano

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • SosHomeGarden
  • Aibay
  • Coinlabs

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.