Google potenzia ulteriormente le capacità del suo assistente AI Gemini. La funzionalità Gemini Live, che permette conversazioni vocali fluide e naturali con l'intelligenza artificiale, si arricchisce di una dimensione visiva e interattiva molto più potente: la possibilità di interagire con Gemini mostrando contenuti direttamente dalla fotocamera del proprio smartphone oppure condividendo in tempo reale ciò che visualizzano sul proprio schermo. Questa evoluzione trasforma Gemini Live da un assistente prevalentemente vocale a un collaboratore multimodale capace di "vedere" e comprendere il contesto visivo dell'utente, sia esso fisico o digitale.

Sebbene l'integrazione di input visivi fosse stata introdotta gradualmente da Google a partire da marzo, l'azienda ha comunicato che questa estensione della funzionalità, che rende l'interazione ancora più ricca, partirà globalmente con gli utenti dell'app Gemini sui nuovi dispositivi Pixel 9 e Samsung Galaxy S25 e per tutti gli utenti Android che sono abbonati a Gemini Advanced, rendendo di fatto accessibili queste capacità avanzate anche agli utenti italiani dotati di tali device. La promessa è quella di un'esperienza utente più intuitiva e contestualizzata, supportata in oltre 45 lingue.

L'integrazione di camera e screen sharing all'interno di Gemini Live apre un ventaglio di possibilità pratiche, trasformando l'AI in un assistente versatile per compiti quotidiani e creativi. Google stessa ha raccolto feedback dagli utenti che già utilizzano queste funzioni a livello internazionale, delineando cinque scenari d'uso che da oggi più utenti potranno sperimentare.

1. Organizzazione domestica intelligente

Affrontare il disordine diventa un'attività collaborativa. Inquadrando con la fotocamera un cassetto, un armadio o uno scaffale caotico, gli utenti italiani possono ora chiedere a Gemini Live suggerimenti su misura per riordinare, massimizzare lo spazio o decidere cosa tenere e cosa eliminare. L'AI fornisce consigli visivi e indicazioni in tempo reale, agendo come un consulente d'organizzazione personale direttamente dallo smartphone.

2. Brainstorming creativo visivo

Il blocco creativo può essere superato grazie a un dialogo visivo con Gemini. Condividendo lo schermo, è possibile mostrare all'AI immagini ispiratrici – texture naturali, scene urbane, palette di colori – e chiedere a Gemini di generare idee per progetti di design, scrittura, artigianato o altre attività artistiche. Una nuova frontiera per il brainstorming che sfrutta l'input visivo per stimolare l'immaginazione.

3.Risoluzione pratica di problemi

Piccoli guasti o difficoltà tecniche trovano un aiuto immediato. Mostrando il problema (una sedia che cigola, un dispositivo elettronico malfunzionante) tramite la fotocamera, si può dialogare con Gemini Live per ottenere una diagnosi preliminare, istruzioni per la riparazione o suggerimenti per la risoluzione, il tutto in tempo reale mentre si ha il problema sott'occhio.

4. Feedback e sviluppo competenze

Migliorare i propri progetti diventa più semplice. Condividendo lo schermo, è possibile sottoporre a Gemini Live bozze di testi, post per social media, fotografie o presentazioni per ricevere un'analisi e un feedback costruttivo. L'AI può offrire suggerimenti su layout, immagini, didascalie e stile generale, aiutando gli utenti a perfezionare il proprio lavoro e a sviluppare le proprie capacità comunicative o creative.

5. Consulenza personalizzata per lo shopping

L'esperienza d'acquisto online diventa più guidata e meno dispersiva. Condividendo lo schermo durante la navigazione su siti e-commerce, si può chiedere a Gemini Live di confrontare prodotti, riassumere recensioni o dare pareri di stile. Utilizzando la fotocamera, si può mostrare un capo del proprio guardaroba per chiedere all'AI consigli sugli abbinamenti con articoli visti online, ricevendo feedback istantanei per decisioni d'acquisto più informate.

L'attivazione della condivisione video da fotocamera e dello screen sharing in Gemini Live per un maggior numero di utenti rappresenta dunque un'importante evoluzione, rendendo l'intelligenza artificiale di Google uno strumento ancora più potente, contestuale e utile. Questa integrazione tra dialogo vocale e comprensione visiva promette di semplificare numerose attività e di aprire nuove strade per l'interazione uomo-macchina nel quotidiano.