image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte di Natale
Accedi a Xenforo
Immagine di OLED e burn-in: questo test smentisce i timori più diffusi OLED e burn-in: questo test smentisce i timori più diffusi...
Immagine di Intel 14A: ecco perché cambierà tutto Intel 14A: ecco perché cambierà tutto...

Il nuovo ChatGPT ha un enorme problema con il cinese e il motivo è molto strano

Un errore nella formazione dei dati fa sì che il nuovo modello gpt-4o di OpenAI generi risposte in cinese piene di spam e pornografia.

Advertisement

Avatar di Giulia Serena

a cura di Giulia Serena

Editor @Tom's Hardware Italia

Pubblicato il 21/05/2024 alle 11:39
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Recentemente, l'azienda OpenAI ha lanciato GPT-4o, un nuovo modello avanzato di linguaggio artificiale che si distingue per le sue funzionalità innovative, tra cui la capacità di "vedere" attraverso le fotocamere degli utenti e di conversare in tempo reale. Tuttavia, nonostante i progressi, è emerso un grave problema riguardante la gestione della lingua cinese.

Per addestrare i modelli di intelligenza artificiale, sono necessari i token, unità di dati che rappresentano informazioni utilizzate dall'AI per "leggere" e apprendere. Ebbene, è stato scoperto che quasi tutti i 100 token cinesi più lunghi utilizzati dal GPT-4o contenevano contenuti inappropriati legati a pornografia e gioco d'azzardo. Questo ha causato risposte inadeguate e fuori contesto alle domande degli utenti, che si aspettavano interazioni normali e pertinenti.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

L'AI ricercatore e dottorando a Princeton, Tianle Cai, ha evidenziato questa problematica in un post su Github, descrivendo la situazione come assurda e mettendo in luce la discrepanza tra la qualità delle risposte in inglese rispetto a quelle in cinese.

Immagine id 818

Il problema principale è stato identificato nell'insufficienza nella pulizia dei dati durante la fase di formazione dell'intelligenza artificiale, una sfida nota nel campo dell'AI che, secondo gli esperti, avrebbe potuto essere superata con maggiori accorgimenti. Per esempio, Deedy Das, investitore di AI presso Menlo Ventures ed ex membro del team di ricerca di Google, ha suggerito che la semplice auto-traduzione dei token per identificare parole chiave problematiche avrebbe potuto risolvere significativamente il problema, migliorando la qualità dei dati del 60%.

Tuttavia, sembra che questa precauzione non sia stata inclusa nelle priorità di OpenAI, nonostante il cinese sia la lingua con più madrelingua al mondo. Questa negligenza potrebbe avere ripercussioni non solo tecniche, ma anche culturali, escludendo di fatto una grande parte di utenti dalla piena fruizione delle potenzialità offerte dall'intelligenza artificiale.

Insomma, il caso solleva questioni importanti sull'importanza di una corretta gestione e pulizia dei dati nell'addestramento dei modelli di AI, soprattutto per assicurare un servizio equo e universale, che includa tutte le lingue e culture. 

Fonte dell'articolo: futurism.com

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Intel 14A: ecco perché cambierà tutto
6

Hardware

Intel 14A: ecco perché cambierà tutto

Di Antonello Buzzi
OLED e burn-in: questo test smentisce i timori più diffusi
2

Hardware

OLED e burn-in: questo test smentisce i timori più diffusi

Di Antonello Buzzi
Addio Crucial: utenti sacrificati sull'altare dell'IA
9

Hardware

Addio Crucial: utenti sacrificati sull'altare dell'IA

Di Marco Pedrani
La GPU ASUS da 4000 dollari è un costosissimo flop
3

Hardware

La GPU ASUS da 4000 dollari è un costosissimo flop

Di Marco Pedrani
Crucial chiude! Micron preferisce l'IA ai consumatori
2

Hardware

Crucial chiude! Micron preferisce l'IA ai consumatori

Di Andrea Maiellano

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.