image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Offerte & Coupon
Accedi a Xenforo
Immagine di Dove vedere Inter vs Juventus in TV e streaming Dove vedere Inter vs Juventus in TV e streaming...
Immagine di Dove vedere Pisa vs Milan in TV e streaming Dove vedere Pisa vs Milan in TV e streaming...

ELIZA, il chatbot degli anni 60 batte ChatGPT-3.5 nel test di Turing

Un nuovo studio ha fatto messo alla prova ChatGPT 3.5 e 4 e il chatbot ELIZA al test di Turing, e i risultati sono a dir poco sorprendenti.

Advertisement

Avatar di Giulia Serena

a cura di Giulia Serena

Editor @Tom's Hardware Italia

Pubblicato il 06/12/2023 alle 12:26
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

Due ricercatori dell'Università della California, San Diego, hanno esaminato le capacità di ChatGPT-4 di OpenAI confrontandolo con partecipanti umani, GPT-3.5 ed ELIZA, un programma basato su regole degli anni '60, per valutare la sua abilità nel convincere gli interrogatori di essere umano. Nonostante il GPT-4 non abbia superato il test, il risultato più sorprendente è stato che gli umani hanno identificato correttamente altri umani solo nel 63% delle interazioni, mentre ELIZA ha superato il modello IA che alimenta la versione gratuita di ChatGPT.

Il test di Turing, concepito da Alan Turing nel 1950 come "The Imitation Game", è un benchmark controverso per valutare la capacità di una macchina di imitare la conversazione umana. Nel recente studio, i ricercatori hanno ospitato un'implementazione del test di Turing online, coinvolgendo 652 partecipanti in sessioni con modelli IA, compresi GPT-4, GPT-3.5 ed ELIZA. Sorprendentemente, ELIZA ha ottenuto un tasso di successo del 27%, superando GPT-3.5 (14%) ma posizionandosi dietro GPT-4 (41%) e gli umani.

GPT-3.5, il modello di base dietro la versione gratuita di ChatGPT, è stato condizionato a non presentarsi come umano, spiegando in parte la sua performance inferiore. GPT-4, nonostante non abbia superato il test di Turing, ha mostrato risultati promettenti, ma gli autori suggeriscono che con il giusto design della provocazione potrebbe ottenere migliori risultati. Tuttavia, la sfida sta nel creare provocazioni che mimino la sottigliezza dello stile di conversazione umano.

Gli interrogatori umani, che hanno giocato il ruolo di giudici nel test, hanno utilizzato strategie come piccole conversazioni, domande su eventi attuali e l'accusa diretta al testimone di essere un modello IA. I partecipanti hanno basato le loro decisioni principalmente su stile linguistico e attributi socio-emotivi anziché solo sull'intelligenza percepita. Anche se il 63% di successo nel riconoscere altri umani potrebbe indicare limitazioni del test di Turing stesso, gli autori ritengono che il test mantenga rilevanza per misurare l'interazione sociale fluida e l'inganno.

In conclusione, sebbene GPT-4 non abbia superato il test di Turing, il suo potenziale resta elevato, ma la sfida persiste nell'elaborare provocazioni che catturino la sottigliezza della conversazione umana. Nel contesto di una società futura in cui le persone potrebbero usare modelli IA per ingannare gli altri, la comprensione delle limitazioni e delle potenzialità di tali sistemi è essenziale.

Fonte dell'articolo: arstechnica.com

Le notizie più lette

#1
Google conferma l’uso malevolo di Gemini AI

Hardware

Google conferma l’uso malevolo di Gemini AI

#2
Xbox Game Pass si arricchisce oggi di tre giochi gratis
2

Videogioco

Xbox Game Pass si arricchisce oggi di tre giochi gratis

#3
Recensione Sony WF-1000XM6, l'evoluzione che aspettavamo
3

Recensione

Recensione Sony WF-1000XM6, l'evoluzione che aspettavamo

#4
La vita potrebbe essere nata da gel aderenti alle rocce

Scienze

La vita potrebbe essere nata da gel aderenti alle rocce

#5
Claude amplia il piano gratis con app e file Office
2

Hardware

Claude amplia il piano gratis con app e file Office

👋 Partecipa alla discussione!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Dove vedere Pisa vs Milan in TV e streaming

Altri temi

Dove vedere Pisa vs Milan in TV e streaming

Di Dario De Vita
Dove vedere Inter vs Juventus in TV e streaming

Altri temi

Dove vedere Inter vs Juventus in TV e streaming

Di Dario De Vita
Dove vedere Napoli vs Roma in TV e streaming

Altri temi

Dove vedere Napoli vs Roma in TV e streaming

Di Dario De Vita
Meglio del robot (per ora): 4 lavapavimenti sotto i 200€ in offerta

Altri temi

Meglio del robot (per ora): 4 lavapavimenti sotto i 200€ in offerta

Di Dario De Vita
2 scelte smart, 1 grande sconto: fino a 500€ con Mediaworld su Haier o Hotpoint

Altri temi

2 scelte smart, 1 grande sconto: fino a 500€ con Mediaworld su Haier o Hotpoint

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2026 3Labs Srl. Tutti i diritti riservati.