Google ha fet un nou pas en la seva estratègia d'intel·ligència artificial amb la presentació de Nano Banana 2, també identificat com Imatge flash de Gemini 3.1, un model de generació i edició d'imatges que cerca reduir al mínim la diferència entre rapidesa de resposta i qualitat visual. La companyia pretén que els qui creen contingut puguin treballar amb imatges gairebé en temps real sense renunciar a resultats detallats i utilitzables en contextos professionals.
El llançament arriba després del primer Nano Banana i de Nano Banana Pro, versions que ja havien consolidat la presència de Google a la generació visual per IA. Amb aquesta nova iteració, la firma aposta per un model que porta funcions abans considerades “de gamma alta” a un flux molt més àgil, pensat per a usuaris que generen imatges de manera freqüent, des d'equips de màrqueting fins a creadors independents i empreses que operen a Europa i altres mercats.
Què és Nano Banana 2 i quin paper juga dins de l'ecosistema Gemini
Google descriu Nano Banana 2 com el model d'imatges més avançat fins a la data dins del entorn Gemini, amb la particularitat que està construït sobre larquitectura Flash, centrada en temps de resposta molt reduïts. L'objectiu és que l'eina no sigui només capaç de produir composicions cridaneres, sinó també d'encaixar en fluxos de treball on els segons marquen la diferència.
A la pràctica, la companyia sosté que Nano Banana 2 hereta el coneixement del món, el raonament i la fidelitat visual de Nano Banana Pro, però els combina amb la velocitat dels models Flash. Això li permetria generar o editar imatges en qüestió de segons, cosa especialment rellevant per als que treballen amb iteracions constants, proves A/B o revisions ràpides amb clients i equips dispersos per diferents països.
El nou model s'orienta tant a la creació des de zero com a la edició de materials existents. Google subratlla que es poden aplicar canvis, ajustaments o variacions sense que cada modificació suposi una espera prolongada, cosa que encaixa amb tasques habituals en agències, departaments de comunicació o petites empreses que gestionen el seu propi contingut visual.
A més, la companyia situa Nano Banana 2 com una peça central de la seva estratègia d'IA generativa: s'integra en productes de consum i en eines per a desenvolupadors, intentant que el mateix model serveixi de base per a experiències al mòbil, al navegador i en entorns de núvol orientats a negoci.
Coneixement del món i suport a la Cerca web
Un dels pilars de Nano Banana 2 és la manera com aprofita la base de coneixement de Gemini. Segons explica Google, el model es pot recolzar en informació del món real i en imatges procedents de la Cerca web en temps real per representar amb més precisió conceptes, objectes o escenes concretes.
Aquesta connexió amb la web us permet generar imatges més alineades amb contextos actuals, cosa útil per a infografies, continguts informatius o visualitzacions de dades que hagin de reflectir situacions específiques. Per a mitjans, blocs especialitzats o departaments de comunicació institucional a Europa, aquesta característica pot facilitar la il·lustració de notícies, informes i presentacions sense partir de zero cada cop.
Google assenyala que aquesta comprensió més profunda també ajuda a convertir notes en diagrames, esquemes i gràfics explicatius. És a dir, el model no només “dibuixa” a partir d'una descripció genèrica, sinó que intenta estructurar la informació de manera visualment clara, especialment interessant en educació, formació corporativa o documentació tècnica.
Amb aquest enfocament, la companyia intenta diferenciar Nano Banana 2 d?altres models centrats únicament en l?impacte estètic. La idea és que l'eina pugui servir tant per a peces artístiques com per a material visual que acompanyi dades, processos o conceptes complexos, reforçant el seu atractiu per a organitzacions que treballen amb informes i anàlisis de manera habitual.
Millor maneig de text dins de la imatge, traducció i localització
Un dels problemes més comentats de la generació d'imatges amb IA ha estat tradicionalment el tractament del text integrat a la pròpia imatge, on errors en lletres o paraules poden arruïnar un disseny que daltra banda seria vàlid. Google assegura que Nano Banana 2 aborda aquest punt amb un salt de qualitat rellevant.
Segons la informació facilitada, el model és capaç de generar text llegible i coherent dins de maquetes de màrqueting, cartells, targetes o banners, reduint el nombre d'intents fallits per errors tipogràfics. Això pot ser especialment pràctic per a equips petits que no compten amb un departament de disseny dedicat i necessiten resultats funcionals amb rapidesa.
A aquestes capacitats se suma la possibilitat de traduir i localitzar text directament dins la imatge. És a dir, el sistema no només detecta el text present en una fotografia o composició, sinó que permet adaptar-lo a diferents idiomes sense haver de reconstruir la peça des de zero. Per a campanyes europees a múltiples mercats, aquesta funció pot estalviar temps i simplificar el procés d'adaptació cultural i lingüística.
En àmbits com el comerç electrònic, el turisme o la formació en línia, aquesta combinació de text llegible, traducció i localització apunta a fluxos de treball més àgils. Una mateixa creativitat podria reutilitzar-se a diversos països, ajustant textos i missatges amb ajuda de la IA en lloc de refer dissenys complets per a cada idioma.
Amb tot això, Nano Banana 2 es posiciona com una eina que intenta reduir una de les friccions clàssiques de la imatge generativa: la necessitat de recórrer a editors externs per polir o corregir el text que apareix a la composició.
Consistència visual, seguiment d'instruccions i qualitat de sortida
Un altre dels blocs clau de l'anunci se centra en el control creatiu i la consistència visual. Google afirma que Nano Banana 2 és capaç de mantenir la semblança de fins cinc personatges dins d'un mateix flux de treball i respectar la fidelitat de fins catorze objectes, de manera que no canviïn dràsticament d'una imatge a una altra.
Aquesta capacitat està pensada per a usos com storyboards, narratives per escenes, campanyes publicitàries o desenvolupament d'universos visuals coherents. En aquests contextos, que un personatge o un producte canviï d'aspecte d'una vinyeta a la següent pot trencar l'experiència, per la qual cosa l'èmfasi en la continuïtat visual és especialment rellevant per a marques i projectes creatius.
La companyia assenyala també una millora al seguiment d'instruccions complexes. El model estaria preparat per interpretar millor els matisos dels prompts -des d'indicacions d'estil fins a restriccions detallades sobre composició, llum o enquadrament- i ajustar-se més fidelment al que l'usuari espera. Això s'hauria de traduir en menys iteracions successives fins a aconseguir un resultat satisfactori.
Al terreny tècnic, Nano Banana 2 ofereix control de relacions d'aspecte i un rang de resolucions que va des de 512 píxels fins a 4K. Amb això, és possible adaptar una mateixa creativitat a formats verticals, horitzontals o panoràmics, cobrint des de publicacions ràpides a xarxes socials fins a fons de pantalla o materials pensats per a pantalles d'alta definició.
Google insisteix que el model presenta una millora general de la fidelitat visual, amb il·luminació més rica, textures millor definides i detalls més nítids, intentant que el mode Flash no es percebi com una opció “retallada”, sinó com una alternativa ràpida que també pot oferir un acabat d'alt nivell. En sectors com ara el comerç electrònic o la comunicació institucional, aquesta combinació de rapidesa i acabat pot marcar diferències en el dia a dia.
Disponibilitat en productes de Google i desplegament internacional
L'anunci de Nano Banana 2 no queda en un entorn de proves aïllat. Google detalla un desplegament ampli al seu ecosistema, que arrenca amb la aplicació de Gemini i s'estén a diversos serveis principals.
A l'app de Gemini, Nano Banana 2 reemplaçarà Nano Banana Pro en les maneres Ràpid, Pensament i Pro, de manera que el nou model es converteixi en l'opció estàndard per als que generen imatges des de l'assistent. No obstant això, la companyia matisa que els subscriptors de Google AI Pro i Ultra seguiran disposant de Nano Banana Pro per a tasques especialitzades, accedint-hi des de les opcions de regeneració d'imatges quan sigui necessari.
El model també arriba a la Cerca de Google a través del Mode IA i Lens, tant a l'aplicació oficial com a navegadors mòbils i d'escriptori. Google destaca que la disponibilitat s'amplia a 141 nous països i territoris ja vuit idiomes addicionals, cosa que reforça la seva vocació d'eina d'ús massiu més enllà de mercats concrets.
En l'àmbit de desenvolupament i núvol, Nano Banana 2 s'ofereix a AI Studio ia través de l'API de Gemini en versió preliminar, permetent a empreses i desenvolupadors integrar la generació d'imatges a les seves pròpies aplicacions. També s'incorpora a Google Cloud mitjançant Vertex AI en fase prèvia, obrint la porta a projectes que necessitin escalar la creació visual des d'infraestructures allotjades al núvol de la companyia.
A més, Google indica que Nano Banana 2 passa a ser el model de generació d'imatges predeterminat a Flow, la seva eina orientada a fluxos creatius i, en alguns casos, producció audiovisual, estant disponible per a tots els usuaris de Flow sense cost addicional en crèdits. En el terreny publicitari, el model s'integra a Anuncis Google per potenciar els suggeriments de creativitats gràfiques en configurar campanyes, cosa que pot tenir impacte directe a la feina d'agències i anunciants a Espanya i la resta d'Europa.
Transparència, procedència i seguretat del contingut generat
Més enllà de les funcions creatives, Google dedica part de l'anunci a la procedència i verificació del contingut generat per IA, un assumpte cada cop més sensible tant per a reguladors com per a usuaris i mitjans de comunicació europeus.
La companyia explica que combina la tecnologia de marca d'aigua SynthID amb credencials de contingut basades en l'estàndard C2PA. D'aquesta manera, les imatges generades amb Nano Banana 2 inclouen senyals invisibles i metadades estandarditzades que permeten conèixer si s'ha utilitzat IA en la seva creació i, en alguns casos, detalls sobre el model emprat i el context de generació.
Google indica que la funció de verificació de SynthID a l'app de Gemini s'ha utilitzat més de 20 milions de vegades des del novembre, cosa que dóna una idea de l'interès per identificar l'origen dels continguts visuals. La companyia avança també la seva intenció d'integrar la verificació de C2PA a l'aplicació, reforçant la traçabilitat en línia amb les discussions reguladores que s'estan produint a Europa al voltant del contingut sintètic.
Aquest èmfasi en la transparència s'alinea amb la necessitat que empreses, administracions públiques i mitjans puguin saber més clarament quan una imatge procedeix d'un model d'IA. En un entorn on les peces visuals es difonen ràpidament per xarxes socials i plataformes digitals, disposar de mecanismes de marcatge i verificació ha esdevingut un element rellevant per a la confiança.
En conjunt, l'estratègia de Google amb Nano Banana 2 combina diverses capes: per una banda, velocitat, qualitat i control creatiu; de l'altra, integració en productes d'ús quotidià i eines professionals; i, a més, mesures de procedència pensades per a un escenari en què el contingut generat per IA tindrà una presència cada cop més visible a la vida diària ia l'activitat econòmica d'Espanya, Europa i altres mercats.