image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Crea un’oasi zen con LEGO Botanicals: PREZZI SHOCK su Amazon! Crea un’oasi zen con LEGO Botanicals: PREZZI SHOCK su Am...
Immagine di Shelly Gen4 e Plus: piccoli dispositivi ma grandi alleati per una casa smart Shelly Gen4 e Plus: piccoli dispositivi ma grandi alleati pe...

ELIZA, il chatbot degli anni 60 batte ChatGPT-3.5 nel test di Turing

Un nuovo studio ha fatto messo alla prova ChatGPT 3.5 e 4 e il chatbot ELIZA al test di Turing, e i risultati sono a dir poco sorprendenti.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Giulia Serena

a cura di Giulia Serena

Editor

Pubblicato il 06/12/2023 alle 12:26

Due ricercatori dell'Università della California, San Diego, hanno esaminato le capacità di ChatGPT-4 di OpenAI confrontandolo con partecipanti umani, GPT-3.5 ed ELIZA, un programma basato su regole degli anni '60, per valutare la sua abilità nel convincere gli interrogatori di essere umano. Nonostante il GPT-4 non abbia superato il test, il risultato più sorprendente è stato che gli umani hanno identificato correttamente altri umani solo nel 63% delle interazioni, mentre ELIZA ha superato il modello IA che alimenta la versione gratuita di ChatGPT.

Il test di Turing, concepito da Alan Turing nel 1950 come "The Imitation Game", è un benchmark controverso per valutare la capacità di una macchina di imitare la conversazione umana. Nel recente studio, i ricercatori hanno ospitato un'implementazione del test di Turing online, coinvolgendo 652 partecipanti in sessioni con modelli IA, compresi GPT-4, GPT-3.5 ed ELIZA. Sorprendentemente, ELIZA ha ottenuto un tasso di successo del 27%, superando GPT-3.5 (14%) ma posizionandosi dietro GPT-4 (41%) e gli umani.

GPT-3.5, il modello di base dietro la versione gratuita di ChatGPT, è stato condizionato a non presentarsi come umano, spiegando in parte la sua performance inferiore. GPT-4, nonostante non abbia superato il test di Turing, ha mostrato risultati promettenti, ma gli autori suggeriscono che con il giusto design della provocazione potrebbe ottenere migliori risultati. Tuttavia, la sfida sta nel creare provocazioni che mimino la sottigliezza dello stile di conversazione umano.

Gli interrogatori umani, che hanno giocato il ruolo di giudici nel test, hanno utilizzato strategie come piccole conversazioni, domande su eventi attuali e l'accusa diretta al testimone di essere un modello IA. I partecipanti hanno basato le loro decisioni principalmente su stile linguistico e attributi socio-emotivi anziché solo sull'intelligenza percepita. Anche se il 63% di successo nel riconoscere altri umani potrebbe indicare limitazioni del test di Turing stesso, gli autori ritengono che il test mantenga rilevanza per misurare l'interazione sociale fluida e l'inganno.

In conclusione, sebbene GPT-4 non abbia superato il test di Turing, il suo potenziale resta elevato, ma la sfida persiste nell'elaborare provocazioni che catturino la sottigliezza della conversazione umana. Nel contesto di una società futura in cui le persone potrebbero usare modelli IA per ingannare gli altri, la comprensione delle limitazioni e delle potenzialità di tali sistemi è essenziale.

Fonte dell'articolo: arstechnica.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Blocco diesel Euro 5 Nord Italia: tutto quello che c'è da sapere
  • #2
    Questa è la tech che salverà le schede video da 8GB
  • #3
    Uno YouTuber ha acquistato uno dei marchi più famosi del retrogaming
  • #4
    Amazon Prime Day, quand'è, quanto dura e come trovare le offerte migliori
  • #5
    Incredibile ma vero: PNG si aggiorna dopo ben 22 anni
  • #6
    Migliori stampanti fotografiche (luglio 2025)
Articolo 1 di 5
Shelly Gen4 e Plus: piccoli dispositivi ma grandi alleati per una casa smart
Sono arrivati i nuovi Shelly Gen4: soluzioni smart con controllo dei consumi per una casa intelligente come mai prima d’ora.
Immagine di Shelly Gen4 e Plus: piccoli dispositivi ma grandi alleati per una casa smart
Leggi questo articolo
Articolo 2 di 5
Crea un’oasi zen con LEGO Botanicals: PREZZI SHOCK su Amazon!
Aggiungi l’eleganza senza tempo dell’albicocco giapponese o delle rose al tuo spazio a meno di 50€, ma affrettati: promozione limitata!
Immagine di Crea un’oasi zen con LEGO Botanicals: PREZZI SHOCK su Amazon!
Leggi questo articolo
Articolo 3 di 5
Da oggi bollette più facili da leggere: come funziona lo “scontrino dell’energia"
Dal 1° luglio arriva il nuovo formato delle bollette energetiche: più chiare, trasparenti e con frontespizio standardizzato per tutti i fornitori.
Immagine di Da oggi bollette più facili da leggere: come funziona lo “scontrino dell’energia"
1
Leggi questo articolo
Articolo 4 di 5
Il phon giusto può cambiare la giornata, anche quando fuori ci sono 40°
Durante le calde giornate estive, può capitare di voler asciugare i capelli all’aria aperta, ma con questo asciugacapelli non vorrete più farlo.
Immagine di Il phon giusto può cambiare la giornata, anche quando fuori ci sono 40°
Leggi questo articolo
Articolo 5 di 5
AFFARE Prime Day: De Longhi Nespresso Vertuo Pop a META' PREZZO!
Approfitta subito dell'offerta riservata Amazon Prime per la De Longhi Nespresso Vertuo Pop, completa di 60 capsule in alluminio riciclato.
Immagine di AFFARE Prime Day: De Longhi Nespresso Vertuo Pop a META' PREZZO!
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.