Google ha donat un pas més en la integració de la intel·ligència artificial en el dia a dia en ampliar les capacitats de Bessons en viu, el seu assistent conversacional amb funcions en temps real. Aquesta evolució permet ara als usuaris interactuar amb la IA no només per veu o text, sinó també a través del que la càmera del mòbil capta o compartint la pantalla del dispositiu. Aquest nou sistema busca així oferir respostes contextualitzades segons l'entorn visual de l'usuari.
Interacció més natural gràcies a la càmera i la pantalla
La darrera novetat de Gemini Live fa un pas més enllà en la idea d'aconseguir un assistent que veritablement actuï amb el món que l'envolta. I és que amb les seves noves funcions anunciades, els usuaris poden ara enfocar amb la càmera diferents elements del vostre entorn -com un calaix desordenat, un objecte defectuós o una peça de roba- i conversar directament amb Gemini per rebre suggeriments o resoldre dubtes. També és possible compartir el que apareix a la pantalla del mòbil, cosa que permet a la IA comprendre amb més profunditat el context de la interacció. En compartir aquesta pantalla, els usuaris poden visualitzar solucions ràpides a diferents plataformes, optimitzant-se així l'experiència.
Aquesta funcionalitat es basa en els avenços del prototip Project Astra, presentat a l'esdeveniment Google I / O de l'any passat, l'objectiu del qual ha estat crear un assistent multimodal capaç de processar text, imatges i vídeos en simultani. En aprofitar aquesta tecnologia, Bessons es converteix en una eina útil per a múltiples tasques com ara compres, creació de continguts, resolució de problemes tècnics o simplement per rebre orientació organitzada sobre l'entorn.
Aquesta funció ja està disponible en determinats dispositius amb Android compatibles: parlem concretament dels Google Pixel 9 y Samsung Galaxy S25, tant a les seves versions estàndard com a les variants Pro i Ultra, encara que s'espera que arribi a més mòbils més endavant. Els subscriptors de Gemini Advanced tenen accés immediat, encara que la funció comença a implementar-se també per a alguns usuaris gratuïts.
Usos pràctics de Gemini Live
La utilitat de la funció en temps real és àmplia i diversa. Entre els usos destacats s'hi inclou la possibilitat de mostrar un armari o prestatgeria desordenada i demanar consell per organitzar millor l'espai. Gemini pot suggerir com classificar objectes, optimitzar l'ordre o fins i tot indicar quins articles podries donar o rebutjar.
En l'àmbit creatiu, els usuaris també poden compartir imatges o dissenys amb Gemini per rebre idees sobre com millorar una maqueta, fer una decoració o escriure un text original. Ja sigui mostrant fotos inspiradores o compartint un projecte a la pantalla, la IA pot actuar com a font d'inspiració per a artistes, estudiants o creadors de contingut., per exemple.
també pot oferir assistència per resoldre fallades tècniques. Per exemple, un usuari pot enfocar una cadira que grinyola o un dispositiu que no respon correctament. Gemini analitza el que veu i proporciona en conseqüència suggeriments ràpids que podrien ajudar a solucionar el problema sense haver de buscar tutorials o ajuts per altra banda.
Un altre ús és utilitzar Gemini com a assessor d'estil o per fer compres. Mitjançant la càmera, es poden mostrar peces de roba per demanar idees sobre com combinar-les, o en compartir pantalla mentre es navega per botigues en línia, l'assistent pot comparar productes, preus i oferir consells basats en el contingut visual.
Finalment, però no menys important, Gemini també pot actuar com una mena de guia visual. En apuntar la càmera cap a un edifici, una planta o un animal, és possible preguntar a la IA de què es tracta, cosa que pot ser útil en viatges. Aquesta funció recorda eines com Google Lens, però portada al següent nivell amb interacció.
La conversa amb Gemini Live a més no es limita a l'anglès. Atès que compta amb suport per a més de 45 idiomes, els usuaris poden parlar amb naturalitat en el vostre idioma de preferència mentre comparteixen imatges o informació des del dispositiu, permetent una comunicació més fluida i propera, adaptada a diferents contextos culturals i fins a formes d'expressió.
Funcionament tècnic i privadesa
Google ha implementat mesures per protegir la privadesa de l'usuari durant l'ús d'aquestes funcions. Per exemple, la càmera només s'activa quan es manté una conversa activa amb la IA, i s'apaga automàticament si es minimitza l'aplicació o es bloqueja la pantalla. El mateix passa amb l'opció de compartir pantalla, que requereix activació manual cada cop que es reinicia la sessió. No t'has de preocupar per això.
A més, el mode d'ús és senzill. Només cal obrir l'aplicació de Gemini, prémer sobre la icona d'àudio per iniciar la conversa, i després seleccionar entre compartir pantalla o activar la càmera del mòbil. Un cop fet això, es pot preguntar lliurement a Gemini sobre què apareix a l'entorn, rebent respostes en temps real i adaptades a la situació.
Les condicions d'ús exigeixen tenir més de 18 anys i residir a països on la funció estigui activada. A més, cal tenir connexió estable a Internet, ja que la comprensió d'imatges i vídeo en directe requereix comunicació contínua amb els servidors de processament de Google. Tingues-ho en compte.