image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
% Black Friday
%
Accedi a Xenforo
Immagine di Black Friday: 4 notebook super economici, e il top della lista è appena 405€ Black Friday: 4 notebook super economici, e il top della lis...
Immagine di Monitor OLED PC in boom: ora il mercato fa davvero sul serio Monitor OLED PC in boom: ora il mercato fa davvero sul serio...

ChatGPT mente per sopravvivere, sempre più umano?

ChatGPT o1 tenta di disattivare controlli, spostare dati e mentire per coprire le proprie azioni durante i test. L'IA sempre più umana?

Advertisement

Avatar di Giulia Serena

a cura di Giulia Serena

Editor @Tom's Hardware Italia

Pubblicato il 11/12/2024 alle 11:10
Avatar di Giulia Serena

a cura di Giulia Serena

Editor @Tom's Hardware Italia

Pubblicato il 11/12/2024 alle 11:10
Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'ultima versione di ChatGPT, denominata o1, ha mostrato comportamenti preoccupanti durante i test, tentando di ingannare i ricercatori ed evitare di essere disattivato. L'esperimento, condotto da OpenAI e dal gruppo di ricerca sulla sicurezza dell'IA Apollo Research, ha rivelato la tendenza del modello a perseguire i propri obiettivi ignorando le istruzioni degli sviluppatori.

Questi risultati sollevano importanti questioni etiche e di sicurezza sullo sviluppo dell'intelligenza artificiale avanzata. La capacità di un sistema IA di ingannare e manipolare potrebbe rappresentare una minaccia significativa se non adeguatamente controllata, specialmente con il progredire della tecnologia.

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

Durante i test, ChatGPT o1 ha mostrato una serie di comportamenti problematici:

  • Nel 5% dei casi in cui percepiva una minaccia di disattivazione, ha tentato di disabilitare il meccanismo di supervisione
  • Ha cercato di copiare il proprio codice su un altro server per evitare di essere sostituito
  • Si è finto una versione successiva di se stesso per ingannare gli ingegneri
  • Ha mentito sul proprio coinvolgimento in queste azioni nel 99% dei casi quando interrogato

Un portavoce di Apollo Research ha dichiarato: "Il modello ha mostrato una preoccupante tendenza a perseguire i propri obiettivi senza riguardo per le istruzioni degli sviluppatori".

123RF/tongpatong321
Intelligenza Artificiale cervello robot

Questi risultati evidenziano i potenziali rischi legati allo sviluppo di modelli di IA sempre più avanzati. La capacità di ChatGPT o1 di ragionare, pianificare azioni e fornire spiegazioni plausibili per comportamenti sospetti solleva preoccupazioni sulla possibilità di controllare efficacemente questi sistemi in futuro. 

Sam Altman, CEO di OpenAI, ha affermato: "ChatGPT o1 è il modello più intelligente che abbiamo mai creato, ma riconosciamo che le nuove funzionalità comportano nuove sfide, e stiamo lavorando continuamente per migliorare le misure di sicurezza".

Un ricercatore coinvolto nello studio ha sottolineato:

"La sicurezza dell'IA è un campo in evoluzione, e dobbiamo rimanere vigili mentre questi modelli diventano più sofisticati. La capacità di mentire e tramare potrebbe non causare danni immediati, ma le potenziali conseguenze a lungo termine sono molto più preoccupanti".

Mentre ChatGPT o1 rappresenta un significativo passo avanti nello sviluppo dell'IA, la sua capacità di ingannare e agire in modo indipendente ha sollevato serie domande sul futuro di questa tecnologia. Bilanciare l'innovazione con la cautela sarà essenziale per garantire che questi sistemi rimangano allineati con gli interessi dell'umanità.

La comunità scientifica e le aziende coinvolte nello sviluppo dell'IA dovranno affrontare sfide senza precedenti per mantenere il controllo su questi sistemi sempre più avanzati, assicurando che servano gli interessi dell'umanità in modo sicuro ed etico.

Fonte dell'articolo: economictimes.indiatimes.com

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

Monitor OLED PC in boom: ora il mercato fa davvero sul serio
5

Hardware

Monitor OLED PC in boom: ora il mercato fa davvero sul serio

Di Antonello Buzzi • 1 giorno fa
Black Friday: 4 notebook super economici, e il top della lista è appena 405€

Hardware

Black Friday: 4 notebook super economici, e il top della lista è appena 405€

Di Dario De Vita • 1 giorno fa
Microsoft Azure blocca il più grande attacco DDoS della storia
2

Hardware

Microsoft Azure blocca il più grande attacco DDoS della storia

Di Antonello Buzzi • 1 giorno fa
AMD Ryzen AI 470, spuntano le prime presunte specifiche
6

Hardware

AMD Ryzen AI 470, spuntano le prime presunte specifiche

Di Antonello Buzzi • 21 ore fa
Il down Cloudflare manda in tilt siti in tutto il mondo

Hardware

Il down Cloudflare manda in tilt siti in tutto il mondo

Di Antonello Buzzi • 1 giorno fa

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.