image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di In calo da ottobre, ora questo SSD a 35€ è più interessante che mai In calo da ottobre, ora questo SSD a 35€ è più interessa...
Immagine di ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione ASUS ROG NUC 2025, potenza desktop in formato mini | Test & ...

Il nuovo ChatGPT ha un enorme problema con il cinese e il motivo è molto strano

Un errore nella formazione dei dati fa sì che il nuovo modello gpt-4o di OpenAI generi risposte in cinese piene di spam e pornografia.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Giulia Serena

a cura di Giulia Serena

Editor

Pubblicato il 21/05/2024 alle 11:39

Recentemente, l'azienda OpenAI ha lanciato GPT-4o, un nuovo modello avanzato di linguaggio artificiale che si distingue per le sue funzionalità innovative, tra cui la capacità di "vedere" attraverso le fotocamere degli utenti e di conversare in tempo reale. Tuttavia, nonostante i progressi, è emerso un grave problema riguardante la gestione della lingua cinese.

Per addestrare i modelli di intelligenza artificiale, sono necessari i token, unità di dati che rappresentano informazioni utilizzate dall'AI per "leggere" e apprendere. Ebbene, è stato scoperto che quasi tutti i 100 token cinesi più lunghi utilizzati dal GPT-4o contenevano contenuti inappropriati legati a pornografia e gioco d'azzardo. Questo ha causato risposte inadeguate e fuori contesto alle domande degli utenti, che si aspettavano interazioni normali e pertinenti.

L'AI ricercatore e dottorando a Princeton, Tianle Cai, ha evidenziato questa problematica in un post su Github, descrivendo la situazione come assurda e mettendo in luce la discrepanza tra la qualità delle risposte in inglese rispetto a quelle in cinese.

Immagine id 818

Il problema principale è stato identificato nell'insufficienza nella pulizia dei dati durante la fase di formazione dell'intelligenza artificiale, una sfida nota nel campo dell'AI che, secondo gli esperti, avrebbe potuto essere superata con maggiori accorgimenti. Per esempio, Deedy Das, investitore di AI presso Menlo Ventures ed ex membro del team di ricerca di Google, ha suggerito che la semplice auto-traduzione dei token per identificare parole chiave problematiche avrebbe potuto risolvere significativamente il problema, migliorando la qualità dei dati del 60%.

Tuttavia, sembra che questa precauzione non sia stata inclusa nelle priorità di OpenAI, nonostante il cinese sia la lingua con più madrelingua al mondo. Questa negligenza potrebbe avere ripercussioni non solo tecniche, ma anche culturali, escludendo di fatto una grande parte di utenti dalla piena fruizione delle potenzialità offerte dall'intelligenza artificiale.

Insomma, il caso solleva questioni importanti sull'importanza di una corretta gestione e pulizia dei dati nell'addestramento dei modelli di AI, soprattutto per assicurare un servizio equo e universale, che includa tutte le lingue e culture. 

Fonte dell'articolo: futurism.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Tornano le ricariche gratis per chi compra Tesla
  • #2
    Luminosità e contrasto: la "terza via" per un televisore ideale
  • #3
    Huawei lancia nuovi PC con CPU e OS cinesi proprietari
  • #4
    Scoperto il trucco mentale per recuperare i ricordi
  • #5
    ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
  • #6
    Fusa la prima rete quantistica a 18 nodi: svolta dalla Cina
Articolo 1 di 5
ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
Un mini PC che racchiude prestazioni gaming di alto livello in appena 3 litri di volume, con processore Intel e GPU NVIDIA RTX 5080.
Immagine di ASUS ROG NUC 2025, potenza desktop in formato mini | Test & Recensione
17
Leggi questo articolo
Articolo 2 di 5
In calo da ottobre, ora questo SSD a 35€ è più interessante che mai
Offerta SSD Integral 480GB SATA III: velocità fino a 540 MB/s in lettura, ideale per PC e laptop a 34,98€
Immagine di In calo da ottobre, ora questo SSD a 35€ è più interessante che mai
Leggi questo articolo
Articolo 3 di 5
iOS 26.2 svela il misterioso Apple Creator Studio
Apple sviluppa Creator Studio, una piattaforma emersa dal codice iOS 26.2 beta che potrebbe unificare gli strumenti creativi professionali dell'azienda.
Immagine di iOS 26.2 svela il misterioso Apple Creator Studio
3
Leggi questo articolo
Articolo 4 di 5
NVIDIA, dopo il danno la beffa: AMD può esportare in Cina
Mentre NVIDIA combatte ancora per poter esportare Blackwell in Cina, AMD ottiene le licenze per gli acceleratori Instinct MI308.
Immagine di NVIDIA, dopo il danno la beffa: AMD può esportare in Cina
2
Leggi questo articolo
Articolo 5 di 5
Google ottiene il via libera per acquisire Wiz
L’acquisizione porta in Google tecnologie nate per proteggere ambienti multicloud complessi, sempre più centrali nelle aziende moderne.
Immagine di Google ottiene il via libera per acquisire Wiz
2
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.