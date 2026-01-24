Durante meses, Gemini ha sido texto, imágenes y vídeo. Ahora, una revisión de su aplicación para Android sugiere que Google prepara el siguiente paso: una herramienta nativa para crear música con inteligencia artificial, integrada directamente en su chatbot.

Durante el último año, Google ha ido ampliando Gemini con una lógica bastante clara: convertirlo en un centro creativo capaz de generar todo tipo de contenidos a partir de texto. Primero llegaron las respuestas avanzadas, luego las imágenes y, más tarde, el vídeo. Pero había una pieza que seguía faltando en el tablero. La música.

Ahora, un nuevo indicio sugiere que ese hueco podría estar a punto de desaparecer. Y lo curioso es que la pista no viene de un anuncio oficial, sino de algo mucho más habitual en el ecosistema Android: una revisión minuciosa del código de la app.

El rastro aparece en el APK de Gemini

© Alphacolor – Unsplash

El hallazgo surge tras analizar la versión 17.2.51.sa.arm64 de la aplicación de Gemini para Android. En su interior, el portal Android Authority identificó fragmentos de código que apuntan directamente a una nueva función relacionada con la generación musical.

Entre las referencias encontradas destaca una especialmente reveladora: MUSIC_GENERATION_AS_TOOL. No es una etiqueta decorativa. Es una forma bastante explícita de describir una capacidad pensada para integrarse como herramienta dentro del propio Gemini.

A eso se suma otro detalle: en la sección My Stuff, donde Gemini organiza los contenidos generados por formato, aparece una nueva categoría dedicada exclusivamente a música. Algo que, hasta ahora, no tenía sentido… salvo que Google esté preparando el terreno.

El precedente: Nano Banana y la creación visual

Para entender por qué esto es relevante, hay que mirar atrás. A mediados del año pasado, Google presentó Nano Banana, una herramienta que permitía generar y editar imágenes usando lenguaje natural, sin necesidad de conocimientos técnicos.

Con el tiempo, Nano Banana evolucionó a una versión Pro, sumando razonamiento avanzado y acceso a información en tiempo real desde la web. La idea era clara: democratizar la creación visual y llevarla al lenguaje conversacional.

La hipótesis ahora es evidente. Google podría estar trabajando en un equivalente musical: una especie de Nano Banana de la música, integrado directamente en Gemini y enfocado a la generación y edición de audio a partir de texto.

Actualmente, Gemini puede tocar el audio solo de forma indirecta. A través de Veo, el modelo de generación de vídeo, es posible obtener piezas audiovisuales que incluyen sonido. Además, Google ofrece Lyra, un modelo orientado a desarrolladores para crear aplicaciones de audio y música.

Pero hay una diferencia clave: ninguna de esas opciones es una función nativa y directa dentro del chatbot de Gemini para el usuario final. No existe, por ahora, un botón para decir “crea una pieza musical” y obtener un archivo reproducible.

Eso es justo lo que este nuevo rastro de código sugiere que podría cambiar.

Una ventaja estratégica frente a sus rivales

Si Gemini incorpora generación musical nativa, Google daría un paso importante frente a la competencia. ChatGPT puede ayudar a componer letras, estructuras o ideas sonoras, pero todavía no permite generar archivos de audio musicales descargables de forma directa.

Adobe, por su parte, presentó recientemente Generate Soundtrack, una herramienta capaz de crear música adaptada a vídeos, pero sigue en fase beta y limitada a su ecosistema creativo.

Una función musical integrada en Gemini colocaría a Google en competencia directa con plataformas especializadas como Suno, Udio o AIVA, pero con una ventaja clara: estar integrada en un chatbot generalista con acceso a texto, imágenes, vídeo y —potencialmente— música, todo en el mismo flujo de trabajo.

Las preguntas incómodas que vuelven a aparecer

Como ocurre siempre que la IA se acerca a la música, el avance técnico viene acompañado de un debate inevitable. Derechos de autor, uso de obras para entrenamiento y el impacto en músicos y compositores vuelven a estar sobre la mesa.

Una herramienta musical nativa en Gemini podría reavivar estas discusiones, especialmente si permite generar piezas completas y utilizables con solo unas líneas de texto. Google ya ha tenido que navegar estas aguas en el terreno visual y audiovisual; hacerlo en música será aún más delicado.

Cuándo llegará y para quién será

Por ahora, no hay confirmación oficial ni detalles técnicos sobre su funcionamiento. Todo apunta a que, de lanzarse, podría estar ligada a determinados niveles de suscripción, como ya ocurre con otras funciones avanzadas de Gemini.

Pero el patrón es claro: primero aparecen las referencias en el código, luego las pruebas internas y, finalmente, el anuncio. Y cuando Google deja este tipo de huellas, rara vez es por accidente.

Si la música entra en Gemini, no será un experimento aislado. Será otra pieza más en la ambición de Google de convertir su IA en una herramienta creativa total. La pregunta no es si podrá generar música, sino qué impacto tendrá cuando cualquiera pueda hacerlo con solo escribir unas palabras.

Nota original en: GIZMODO