Gemini es prepara per crear cançons a partir de text

  • Google treballa en una eina de Gemini per generar música a partir d'indicacions de text dins de l'app.
  • Les referències a l'APK d'Android apunten a la funció MUSIC_GENERATION_AS_TOOL ia una secció musical a My Stuff.
  • La tecnologia es recolzaria a Lyria, el model musical de Google ja disponible via API, ara orientat a l'usuari final.
  • Persisteixen dubtes sobre data de llançament, disponibilitat a Europa i model d'accés (gratuït o lligat a plans premium).

Gemini generarà cançons a partir de text

Veure una escena d'acció en silenci és com menjar pa sense sal: la música és la que posa nervi i personalitat al que veiem, però no tothom sap compondre una banda sonora des de zero. En aquest forat es vol colar Google, que fa un temps que trasteja amb models musicals dins del seu ecosistema i ara prepara un pas més ambiciós amb Gemini.

Diverses anàlisis recents del codi de la aplicació de Gemini per a Android apunten a una nova funció capaç de generar cançons a partir de text. Encara no hi ha anunci oficial, però les referències tècniques són força clares: la companyia està preparant una eina musical integrada a l'assistent, pensada perquè qualsevol pugui crear pistes d'àudio sense necessitat d'estudis d'enregistrament, instruments ni programari complex.

D'experiments aïllats a funció nativa a l'app de Gemini

Fins ara, Google havia deixat entreveure el seu interès per la música generada amb IA en projectes més discrets, com a certes característiques de la app de Gravadora als mòbils Pixel més recents o proves acotades en combinació amb models de vídeo com Veo. En aquests casos, la IA intervenia per acompanyar imatges o clips, però no existia una eina musical clarament integrada al dia a dia de l'usuari.

Això comença a canviar amb allò que s'ha trobat al esbudellar l'APK de la versió 17.2.51.sa.arm64 de l'app de Gemini per a Android. Al codi apareixen mencions explícites a una utilitat interna batejada com “MUSIC_GENERATION_AS_TOOL”, denominació que encaixa amb una nova capacitat específica per crear música dins de l'assistent. El fet que aquesta referència ja figuri a l'aplicació, encara que encara no visible per al públic, indica que el desenvolupament es troba en una fase relativament avançada.

Al costat d'aquesta eina, també s'han detectat noves referències a una categoria dedicada a la música a la secció “My Stuff” (Les meves coses) de Gemini. Aquesta àrea, pensada per agrupar allò que l'usuari genera amb la IA (textos, imatges i altres continguts), passaria a incloure també composicions sonores. D'aquesta manera, seria possible guardar, organitzar i reproduir les pistes generades sense sortir de la pròpia app, una cosa especialment còmoda per reutilitzar fragments en vídeos, podcast o presentacions.

La novetat clau és que la música deixaria de ser un experiment aïllat per convertir-se en una capacitat nativa més de l'assistent, al mateix nivell que la generació d'imatges o la redacció de textos. Dins de l'ecosistema de Gemini, la creativitat passaria a moure's en tres fronts principals: imatge, paraula escrita i ara també àudio, tot centralitzat en una única interfície.

Eina musical de Gemini

El paper de Lyria i l'experiència prèvia de Google amb música amb IA

Aquest moviment no sorgeix del no-res. Google fa temps que treballa amb models específics per a composició musical mitjançant intel·ligència artificial. Entre ells destaca Líria, un sistema dissenyat per crear peces instrumentals i controlar-ne l'evolució en temps real, que fins ara s'ha ofert principalment a través de l'API de Gemini i en projectes pilot amb desenvolupadors.

Gràcies a Lyria, ja és possible que aplicacions de tercers permetin als usuaris generar, dirigir i reproduir música instrumental de forma interactiva, com va passar amb la banda creada per IA. Tot i això, aquestes capacitats quedaven, a la pràctica, una mica allunyades de l'usuari mitjà: requerien integrar l'API, dissenyar una interfície pròpia i, en molts casos, comptar amb cert bagatge tècnic. La nova funció apuntada a Gemini canviaria aquest enfocament en portar aquesta tecnologia directament a l'aplicació mòbil.

A l'ecosistema de Google, Lyria també s'ha utilitzat com a complement de models com Veig, centrat en la generació de vídeo, per crear bandes sonores ajustades a clips generats per IA. Amb la integració musical a Gemini, aquesta possibilitat d'acompanyar imatges amb àudio sintètic quedaria a un toc de pantalla, sense necessitat d'acudir a serveis separats ni manipular configuracions complexes, cosa que connecta amb debats sobre problemes de la IA a YouTube.

La clau d'aquest gir és a la accessibilitat. En comptes d'exigir coneixements de programació o producció, la idea és que qualsevol persona pugui sol·licitar cançons, melodies o fons sonors mitjançant descripcions en llenguatge natural. Des de creadors de contingut que busquen música de fons per als vídeos fins a estudiants que volen una pista per concentrar-se o fer esport, el ventall potencial d'usos és ampli tant a Espanya com a la resta d'Europa.

A nivell d'estratègia, que Gemini incorpori aquesta funció reforça l'aposta de Google per un assistent que actuï com a centre creatiu unificat. La companyia competeix no només en el terreny de les respostes conversacionals, sinó també en les eines que ajuden a produir contingut multimèdia, un espai on la música generada per IA pot marcar diferències davant d'altres serveis.

Com podria funcionar la generació de cançons a partir de text

Tot i que la interfície final encara no s'ha fet pública, les referències trobades i el paral·lelisme amb altres funcions de Gemini permeten imaginar un esquema d'ús força clar. El més probable és que lusuari hagi de escriure un prompt descrivint el tipus de música que voleu, de forma similar a com es demanen imatges. Per exemple: “tema de rock vuitanta motivador per entrenar”, “banda sonora èpica per a un tràiler” o “música electrònica suau per estudiar a la nit”.

A partir d'aquesta descripció, l'assistent combinaria la capacitat de interpretar llenguatge natural amb el model musical subjacentgenerant una peça que s'ajusti a l'estil, a l'ambient i, possiblement, a la durada indicada. L'experiència s'assemblaria molt a les eines de generació d'imatges ja conegudes: l'usuari escriu unes línies, espera uns segons i rep un resultat llest per escoltar.

El codi analitzat també suggereix que podrien existir controls bàsics per afinar el resultat: potser ajustaments d'intensitat, instruments predominants, presència o no de veu sintètica o variacions sobre una mateixa idea musical. No hi ha detalls confirmats, però encaixaria amb lenfocament de Google doferir una interfície senzilla amb opcions mínimes però pràctiques.

Una altra peça important és la categoria de música dins de “My Stuff”. Des d'aquí, els usuaris podrien guardar diferents versions d'un tema, organitzar els vostres projectes sonors i reproduir-los quan vulguin, com si fos una petita biblioteca musical personal creada amb IA. Aquest espai també facilitaria tornar a treballar sobre una base anterior o compartir fragments a altres serveis de l'ecosistema de Google.

Sigui quin sigui el disseny final, sembla que la intenció és clara: portar a l'àudio la mateixa immediatesa que ja s'ofereix en la generació d'imatges i text. Si el sistema resulta prou intuïtiu, és probable que molts usuaris integrin la creació musical a les seves converses habituals amb Gemini, ja sigui per enviar un missatge amb una melodia personalitzada o per acompanyar projectes més elaborats.

Limitacions, accés i possibles filtres per drets d'autor

Les cadenes de text trobades a l'aplicació també deixen entreveure possibles restriccions d'accés en funció del tipus de compte. No es descarta que la nova eina de música quedi inicialment vinculada a subscripcions de pagament, com les de Gemini Avançat o plans de Google One amb funcions d'IA ampliades, de manera que els usuaris gratuïts tinguin un accés limitat o entrin més tard.

En paral·lel, tot apunta que s'implantaran filtres per evitar la generació de cançons massa semblants a obres comercials ja existents o la imitació de veus dartistes concrets sense permís. La indústria musical fa mesos que està especialment pendent de la irrupció de la IA, ia Europa, a més, marc regulador en matèria de drets d'autor i ús de dades obliga a ser prudents amb aquest tipus de ferramentes.

És raonable pensar que la funció imposarà barreres quan l'usuari intenti demanar alguna cosa com a “cançó igual que tal artista” o “veu idèntica a tal cantant” sense permís; de fet, és probable que Google apliqui polítiques contra la música generada per IA per evitar abusos. La normativa comunitària exigeix ​​transparència en els models d'IA i compte amb els continguts protegits, per la qual cosa Google haurà d'equilibrar la flexibilitat creativa amb respecte a la propietat intel·lectual si voleu desplegar l'eina sense sobresalts legals a la Unió Europea.

A més de les limitacions per drets, quedaria veure si s'introdueixen topalls en la durada de les pistes o en el nombre de cançons que es poden generar en un determinat període, cosa habitual en serveis d'IA avançats. Aquestes restriccions podrien servir tant per controlar el consum de recursos com per gestionar la càrrega als servidors mentre la funció s'assenta.

Pels usuaris finals, especialment creadors de contingut a Espanya ia la resta d'Europa, el punt clau serà entendre en quines condicions poden reutilitzar la música que generi Gemini. Si la companyia aclareix que les pistes es poden fer servir lliurement en xarxes socials, podcasts o projectes comercials, l'eina es pot convertir en un recurs molt atractiu davant de bancs d'àudio tradicionals o solucions de tercers.

Música generada per IA amb Gemini

Estat del desenvolupament, desplegament i possible impacte a Europa i Espanya

De moment, tot el que se sap procedeix de anàlisi de l'aplicació i filtracions tècniques. Google no ha comunicat públicament ni la data de llançament ni laspecte definitiu daquesta funció musical. El fet que ja aparegui referenciada a la versió 17.2.51.sa.arm64 de l'app apunta que el projecte és viu, però també que segueix en fase de proves internes.

Continua sent una incògnita si la companyia optarà per un desplegament escalonat per països o si intentarà llançar l'eina de forma més o menys simultània als principals mercats. En el cas concret de la Unió Europea, les exigències del futur marc regulador de l'IA i les normes vigents sobre propietat intel·lectual podrien influir tant en els terminis com en les característiques disponibles a cada regió.

Per a usuaris a Espanya, l'arribada d'aquesta funció obriria una alternativa integrada a l'entorn de Google davant de plataformes que ja ofereixen pistes personalitzades generades per IA. El fet de poder treballar directament des de l'app de Gemini, sincronitzar les creacions amb el compte de Google i tenir-les accessibles des de diferents dispositius suposaria un avantatge pràctic davant serveis externs dispersos.

Encara no és clar tampoc quin model econòmic triarà Google. La companyia podria oferir una versió gratuïta limitada en qualitat o nombre de pistes, reservant l'experiència més completa per als que paguin una subscripció, o bé situar la generació musical des del principi a la categoria de funcions premium. D'aquesta decisió dependrà en gran mesura que aquesta tecnologia arribi al gran públic o quedi en mans dels que ja paguen per eines avançades d'IA.

Si finalment es confirma la integració i es resolen les qüestions legals, no seria estrany veure a curt termini creadors de contingut en espanyol incorporant música generada per Gemini a vídeos curts, pòdcast, materials educatius o presentacions corporatives. Igual que avui s'utilitzen assistents d'IA per redactar guions, resumir documents o generar imatges, la composició musical es podria convertir en un pas més dins d'aquest flux creatiu digital.

Tot apunta que estem davant de l'intent de Google d'acostar la composició a qualsevol persona amb un mòbil a la butxaca: una funció amb què n'hi haurà prou amb escriure unes línies perquè Gemini torni una cançó llesta per sonar, sempre que la companyia aconsegueixi polir l'experiència, aclarir l'encaix legal i decidir com la posa a les mans dels usuaris d'Espanya, Europa i la resta del món.

Spotify etiquetarà cançons creades amb intel·ligència artificial
Article relacionat:
Spotify etiquetarà cançons creades amb intel·ligència artificial

Segueix-nos a Google News