image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Sconti & Coupon
Accedi a Xenforo
Immagine di Cosa aspettarsi da Windows 11 25H2: tutte le novità Cosa aspettarsi da Windows 11 25H2: tutte le novità...
Immagine di Il futuro dello storage è negli SSD da 1 Petabyte Il futuro dello storage è negli SSD da 1 Petabyte...

Il nuovo ChatGPT-o1 batte gli umani negli indovinelli

OpenAI ha rilasciato questa settimana il tanto atteso modello Strawberry per ChatGPT, vantando le sue capacità in ambiti complessi.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author

Pubblicato il 14/09/2024 alle 09:00

OpenAI ha rilasciato questa settimana il tanto atteso modello Strawberry per ChatGPT, vantando le sue capacità in ambiti complessi come programmazione, realizzazione di sequenze geniche e fisica quantistica.

Tuttavia, un test molto più pratico ha rivelato risultati contrastanti su compiti più comuni. Il nuovo modello, disponibile nelle versioni o1-preview e o1-mini su ChatGPT, si è dimostrato estremamente efficace nel risolvere enigmi e indovinelli logici, superando le capacità umane in termini di velocità.

Il nuovo modello di OpenAI usa pronomi in prima persona, cercando di risultare ancora più realistico e umano.

L'IA è in grado di scomporre il ragionamento in passaggi logici, rendendo visibile il processo di risoluzione. Tuttavia, quando si tratta di creare nuovi indovinelli o utilizzare l'umorismo, il modello mostra evidenti limiti.

Pur comprendendo la struttura logica, non riesce a fare il salto creativo necessario per generare contenuti divertenti o originali.

Il test è stato esteso a situazioni di vita quotidiana, come problemi meccanici di un'auto o consigli sulle relazioni. In questi casi, l'IA ha fornito risposte sensate e logiche, ma prive di originalità o intuizioni particolari.

Ad esempio, sui rumori sospetti di un'auto ha elencato una serie di possibili cause e soluzioni standard. Per quanto riguarda il flirt, ha proposto una lista di comportamenti da osservare, ma senza offrire spunti davvero innovativi.

È interessante notare come l'IA utilizzi pronomi in prima persona nel formulare le risposte, quasi mimando il processo di ragionamento di una persona reale. Frasi come "Sto analizzando le varie cause di un rumore mentre si guida" danno l'impressione di un'entità pensante.

Immagine id 34321

I modelli o1-preview e o1-mini non offrono tutte le funzionalità delle versioni complete di ChatGPT, come l'analisi di immagini o documenti. Tuttavia, si distinguono per velocità e capacità logiche, fornendo sempre una spiegazione dettagliata del ragionamento seguito. Siamo curiosi di vedere quante di queste funzioni verranno integrate anche all'interno di iOS 18, una volta che Apple Intelligence arriverà anche da noi (fra l'altro, avete già preordinato i nuovi iPhone su Amazon?).

Nonostante l'impressionante abilità nel risolvere problemi logici, questi modelli mostrano chiari limiti quando si tratta di creatività e inventiva. Possono risolvere enigmi esistenti, ma faticano a crearne di nuovi o a proporre soluzioni davvero originali.

In conclusione, il modello Strawberry di OpenAI rappresenta un notevole passo avanti nelle capacità logiche dell'intelligenza artificiale, ma evidenzia anche i limiti attuali in termini di creatività e pensiero laterale. Mentre eccelle in compiti strutturati e logici, fatica ancora a replicare gli aspetti più intuitivi e imprevedibili dell'intelligenza umana.

Fonte dell'articolo: www.techradar.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Compra una RTX 5090 ma ci trova dentro tre zaini
  • #2
    Nintendo Switch 2: confermata una funzione attesa da anni
  • #3
    Google sta preparando una UI proprietaria per i Pixel
  • #4
    Il futuro dello storage è negli SSD da 1 Petabyte
  • #5
    La Jeep Compass si paga meno di 300 euro al mese
  • #6
    È record: 1 milione di Gb/s su fibra ottica lunga "da Berlino a Napoli"
Articolo 1 di 5
Il futuro dello storage è negli SSD da 1 Petabyte
L'esigenza di gestire enormi quantità di dati "tiepidi", ha spinto a sviluppare una soluzione innovativa e potenzialmente rivoluzionaria.
Immagine di Il futuro dello storage è negli SSD da 1 Petabyte
6
Leggi questo articolo
Articolo 2 di 5
Cosa aspettarsi da Windows 11 25H2: tutte le novità
Windows 11 versione 25H2, attualmente in fase avanzata di sviluppo, rappresenta il prossimo aggiornamento annuale del sistema operativo.
Immagine di Cosa aspettarsi da Windows 11 25H2: tutte le novità
9
Leggi questo articolo
Articolo 3 di 5
Firefox rilascia un update per risolvere i bug con NVIDIA
La recente versione 139.0.1 di Mozilla Firefox risolve finalmente un fastidioso bug grafico che ha tormentato numerosi utenti NVIDIA.
Immagine di Firefox rilascia un update per risolvere i bug con NVIDIA
Leggi questo articolo
Articolo 4 di 5
Un Ryzen AI Max economico è spuntato su Geekbench
L'apparizione del Ryzen AI Max 385 octa-core nei benchmark di Geekbench segna un importante punto di svolta nella strategia di AMD.
Immagine di Un Ryzen AI Max economico è spuntato su Geekbench
1
Leggi questo articolo
Articolo 5 di 5
La caduta di "Stern" il leader dei Ransomware
La polizia federale tedesca ha identificato il cervello dietro un'organizzazione criminale che ha orchestrato il furto di centinaia di milioni di dollari.
Immagine di La caduta di "Stern" il leader dei Ransomware
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.