image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Dove vedere Bologna - Napoli in TV e streaming Dove vedere Bologna - Napoli in TV e streaming...
Immagine di Star Trek arriva in versione LEGO: ecco il set che tutti i fan aspettavano Star Trek arriva in versione LEGO: ecco il set che tutti i f...

ELIZA, il chatbot degli anni 60 batte ChatGPT-3.5 nel test di Turing

Un nuovo studio ha fatto messo alla prova ChatGPT 3.5 e 4 e il chatbot ELIZA al test di Turing, e i risultati sono a dir poco sorprendenti.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Giulia Serena

a cura di Giulia Serena

Editor

Pubblicato il 06/12/2023 alle 12:26

Due ricercatori dell'Università della California, San Diego, hanno esaminato le capacità di ChatGPT-4 di OpenAI confrontandolo con partecipanti umani, GPT-3.5 ed ELIZA, un programma basato su regole degli anni '60, per valutare la sua abilità nel convincere gli interrogatori di essere umano. Nonostante il GPT-4 non abbia superato il test, il risultato più sorprendente è stato che gli umani hanno identificato correttamente altri umani solo nel 63% delle interazioni, mentre ELIZA ha superato il modello IA che alimenta la versione gratuita di ChatGPT.

Il test di Turing, concepito da Alan Turing nel 1950 come "The Imitation Game", è un benchmark controverso per valutare la capacità di una macchina di imitare la conversazione umana. Nel recente studio, i ricercatori hanno ospitato un'implementazione del test di Turing online, coinvolgendo 652 partecipanti in sessioni con modelli IA, compresi GPT-4, GPT-3.5 ed ELIZA. Sorprendentemente, ELIZA ha ottenuto un tasso di successo del 27%, superando GPT-3.5 (14%) ma posizionandosi dietro GPT-4 (41%) e gli umani.

GPT-3.5, il modello di base dietro la versione gratuita di ChatGPT, è stato condizionato a non presentarsi come umano, spiegando in parte la sua performance inferiore. GPT-4, nonostante non abbia superato il test di Turing, ha mostrato risultati promettenti, ma gli autori suggeriscono che con il giusto design della provocazione potrebbe ottenere migliori risultati. Tuttavia, la sfida sta nel creare provocazioni che mimino la sottigliezza dello stile di conversazione umano.

Gli interrogatori umani, che hanno giocato il ruolo di giudici nel test, hanno utilizzato strategie come piccole conversazioni, domande su eventi attuali e l'accusa diretta al testimone di essere un modello IA. I partecipanti hanno basato le loro decisioni principalmente su stile linguistico e attributi socio-emotivi anziché solo sull'intelligenza percepita. Anche se il 63% di successo nel riconoscere altri umani potrebbe indicare limitazioni del test di Turing stesso, gli autori ritengono che il test mantenga rilevanza per misurare l'interazione sociale fluida e l'inganno.

In conclusione, sebbene GPT-4 non abbia superato il test di Turing, il suo potenziale resta elevato, ma la sfida persiste nell'elaborare provocazioni che catturino la sottigliezza della conversazione umana. Nel contesto di una società futura in cui le persone potrebbero usare modelli IA per ingannare gli altri, la comprensione delle limitazioni e delle potenzialità di tali sistemi è essenziale.

Fonte dell'articolo: arstechnica.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca quadrati

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Microsoft si scusa con 2,7 milioni di utenti
  • #2
    Intel abbandona gli E-Core su desktop: arriva Bartlett Lake
  • #3
    iOS 26.2 svela il misterioso Apple Creator Studio
  • #4
    Non puoi parlare se non sei competente, la Cina blocca gli influencer
  • #5
    Il 6G abbatterà ogni limite di copertura
  • #6
    Tutti vogliono un MacBook. Tu puoi avere un ottimo laptop spendendo un terzo
Articolo 1 di 5
Star Trek arriva in versione LEGO: ecco il set che tutti i fan aspettavano
Il leggendario U.S.S. Enterprise NCC-1701-D di Star Trek: The Next Generation arriva in versione LEGO, un modello da 3.600 pezzi per adulti.
Immagine di Star Trek arriva in versione LEGO: ecco il set che tutti i fan aspettavano
Leggi questo articolo
Articolo 2 di 5
Dove vedere Bologna - Napoli in TV e streaming
Bologna e Napoli saranno tra i protagonisti dell'11° giornata di Serie A 2025/2026. Ecco quando inizia la partita e come vederla in streaming.
Immagine di Dove vedere Bologna - Napoli in TV e streaming
Leggi questo articolo
Articolo 3 di 5
Dove vedere Inter - Lazio in TV e streaming
Inter e Lazio saranno tra i protagonisti dell'11° giornata di Serie A 2025/2026. Ecco quando inizia la partita e come vederla in streaming.
Immagine di Dove vedere Inter - Lazio in TV e streaming
Leggi questo articolo
Articolo 4 di 5
MOVA V50 Ultra Complete: il robot di fascia premium, che costa meno | Test & Recensione
Un robot aspirapolvere che sfida i top di gamma con soluzioni ingegneristiche avanzate, ma non privo di compromessi da considerare.
Immagine di MOVA V50 Ultra Complete: il robot di fascia premium, che costa meno | Test & Recensione
1
Leggi questo articolo
Articolo 5 di 5
Sta per scadere l’episodio 1 del Black Friday Mediaworld: ecco i migliori sconti
Oggi 7 novembre scade l'episodio 1 del Black Friday di Mediaworld. Diamo un'occhiata alle migliori offerte, quelle che potrebbero non ripresentarsi in altri episodi.
Immagine di Sta per scadere l’episodio 1 del Black Friday Mediaworld: ecco i migliori sconti
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.