image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
% Black Friday
%
Accedi a Xenforo
Immagine di Dalla Cina una CPU che sorprende nei test e sfida Intel Dalla Cina una CPU che sorprende nei test e sfida Intel...
Immagine di La GPU bandita di NVIDIA è più veloce del previsto La GPU bandita di NVIDIA è più veloce del previsto...

Gemini 2.5 debutta con controllo web e Android

Google presenta l'anteprima del modello Gemini 2.5 Computer Use per sviluppatori, alla base di Project Mariner e funzionalità agentiche di AI Mode.

Advertisement

Avatar di Andrea Maiellano

a cura di Andrea Maiellano

Author @Tom's Hardware Italia

Pubblicato il 08/10/2025 alle 08:28

La notizia in un minuto

  • Google lancia Gemini 2.5 Computer Use, un'IA rivoluzionaria capace di navigare e operare sui siti web come farebbe un utente umano, attraverso un ciclo continuo di screenshot, analisi e azioni concrete
  • Il sistema può eseguire operazioni complesse multi-step come gestione CRM, organizzazione contenuti digitali e automazione di flussi di lavoro, superando le performance di Claude e OpenAI con la latenza più bassa del settore
  • La tecnologia è già disponibile in anteprima per sviluppatori tramite Google AI Studio e Vertex AI, alimentando internamente Project Mariner e i test delle interfacce utente di Google

Riassunto generato con l’IA. Potrebbe non essere accurato.

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più

L'IA di Google sta per entrare in una fase completamente nuova con l'introduzione di sistemi capaci di interagire direttamente con le interfacce utente, proprio come farebbe un essere umano. Google ha appena reso disponibile per gli sviluppatori l'anteprima di Gemini 2.5 Computer Use, un modello specializzato che rappresenta il cuore tecnologico dietro Project Mariner e le funzionalità di AI Mode. Si tratta di un salto qualitativo significativo nel panorama dell'automazione digitale, dove l'IA non si limita più a fornire risposte testuali ma può effettivamente "navigare" e operare sui siti web.

Come funziona l'intelligenza artificiale che naviga sul web

AI Week
Codice sconto copiato!
AI Week Logo

Se l'Intelligenza Artificiale è il tuo futuro, iscriviti subito alla AI Week 2026 per approfondire tutti questi temi con gli esperti.

  1. Utilizza il codice sconto esclusivo per i lettori di Tom's Hardware:
  2. Acquista il tuo biglietto prima che sia troppo tardi!
    Iscriviti ora!

Il meccanismo alla base di questa tecnologia si articola attraverso un ciclo continuo di azioni che ricorda il modo in cui un utente esperto interagirebbe con un computer. Il processo inizia quando il sistema riceve una richiesta che include la richiesta dell'utente, uno screenshot dell'ambiente di lavoro e una cronologia delle azioni recenti. L'IA analizza questi elementi e genera una risposta sotto forma di chiamata a funzione, che può tradursi in azioni concrete come cliccare su un pulsante o digitare del testo.

Una volta eseguita l'azione, il sistema cattura un nuovo screenshot dell'interfaccia grafica insieme all'URL corrente, inviando queste informazioni nuovamente al modello Computer Use. Questo ciclo si ripete fino al completamento dell'attività richiesta, creando un flusso di lavoro automatizzato che può gestire compiti complessi su più pagine web.

Capacità operative e performance sui dispositivi

Le competenze di Gemini 2.5 Computer Use vanno ben oltre il semplice clicking. Il modello è in grado di eseguire navigazione avanti e indietro, ricerche web, spostamenti verso URL specifici, passaggio del cursore su elementi, combinazioni di tasti, scorrimento delle pagine e operazioni di trascinamento e rilascio. Google ha ottimizzato principalmente questo sistema per i browser web, ma ha dimostrato risultati promettenti anche su dispositivi mobili attraverso il benchmark "AndroidWorld".

L'IA può ora operare sui siti web come farebbe un utente esperto

Confrontato con le soluzioni di Claude e OpenAI, Gemini 2.5 Computer Use ha mostrato performance superiori sia sui benchmark di controllo web che mobili. Particolarmente interessante è il fatto che Google rivendica la leadership qualitativa nel controllo dei browser con la latenza più bassa del settore, un aspetto cruciale per l'esperienza utente in applicazioni real-time.

Esempi pratici e casi d'uso concreti

Per dimostrare le potenzialità del sistema, Google ha condiviso due esempi pratici accelerati a velocità triplicata. Il primo scenario coinvolge un'attività complessa di gestione clienti: il sistema deve recuperare dettagli di animali domestici residenti in California da un sito web, aggiungerli come ospiti in un CRM di spa per animali, e programmare un appuntamento di follow-up con uno specialista per una data specifica dopo le 8 del mattino.

Il secondo esempio riguarda l'organizzazione di contenuti digitali per un club artistico, dove l'IA deve riordinare note adesive virtuali in categorie appropriate su una bacheca digitale caotica. Questi casi d'uso evidenziano come la tecnologia possa gestire flussi di lavoro multi-step che richiederebbero normalmente intervento umano significativo.

Fondamenta tecnologiche e applicazioni interne

Il modello si basa sulle capacità di comprensione visiva e ragionamento di Gemini 2.5 Pro, e versioni di questa tecnologia alimentano già Project Mariner e le funzionalità agentiche di AI Mode. Internamente, Google utilizza questo sistema per accelerare i test delle interfacce utente nello sviluppo software, dimostrando la maturità della soluzione anche in contesti professionali.

L'azienda ha inoltre avviato un programma di accesso anticipato per sviluppatori di terze parti che stanno costruendo assistenti e strumenti di automazione dei flussi di lavoro. Gemini 2.5 Computer Use è disponibile in anteprima pubblica attraverso l'API Gemini in Google AI Studio e Vertex AI, con possibilità di testarlo immediatamente in un ambiente demo ospitato da Browserbase.

Questa evoluzione rappresenta un punto di svolta nel rapporto tra intelligenza artificiale e interfacce digitali, aprendo scenari inediti per l'automazione di attività complesse che fino a oggi richiedevano necessariamente l'intervento umano.

Fonte dell'articolo: 9to5google.com

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione

Advertisement

Ti potrebbe interessare anche

La GPU bandita di NVIDIA è più veloce del previsto
1

Hardware

La GPU bandita di NVIDIA è più veloce del previsto

Di Antonello Buzzi
Dalla Cina una CPU che sorprende nei test e sfida Intel
4

Hardware

Dalla Cina una CPU che sorprende nei test e sfida Intel

Di Antonello Buzzi
Se odi Windows 11, allora devi fare questa cosa!
9

Hardware

Se odi Windows 11, allora devi fare questa cosa!

Di Andrea Ferrario
TSMC conferma il blackout al Fab 21 in Arizona
5

Hardware

TSMC conferma il blackout al Fab 21 in Arizona

Di Antonello Buzzi
8 PC scontati che dimostrano quanto valga una RTX Nvidia

Hardware

8 PC scontati che dimostrano quanto valga una RTX Nvidia

Di Dario De Vita

Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.