En Resumen

  • Google lanzó Lyria 3 en Gemini, permitiendo generar pistas musicales de 30 segundos con letra e instrumentales desde una descripción o foto.
  • El modelo navega bien géneros mainstream como pop y R&B, pero muestra limitaciones con estilos inusuales frente a rivales como Suno y Udio.
  • Todas las pistas incluyen SynthID, la marca de agua de IA de Google, disponible para usuarios mayores de 18 años en escritorio desde hoy.

Google ha pasado años construyendo silenciosamente su modelo de IA para música. El martes, finalmente lo colocó en un lugar donde todos pueden usarlo.

Lyria 3, el último modelo de generación musical de Google DeepMind, ya está disponible en versión beta dentro de la aplicación Gemini, permitiendo a cualquier usuario mayor de 18 años describir una idea o subir una foto y obtener una pista completamente producida en segundos—letra, instrumentales y portada generada por IA incluidas.

"Solo describe una idea o sube una foto, como 'un slow jam cómico de R&B sobre un calcetín buscando su par' y en cuestión de segundos, Gemini lo traducirá en una pista pegajosa y de alta calidad", señaló Google en su blog oficial. "Para llevar la creatividad más lejos, incluso puedes pedirle a Gemini que se inspire en algo que subas".

Lo pusimos a prueba. La versión corta: funciona, es divertido, y puede impresionar a quien nunca haya usado otros modelos de vanguardia como Suno o Udio. Para quienes sí los han usado, no reemplazará sus flujos de trabajo en el corto plazo.

Las pistas que produce Lyria 3 tienen 30 segundos de duración. Ese es el límite por ahora, y Google lo reconoce abiertamente—el objetivo declarado no es crear canciones comerciales pulidas, sino generar momentos para compartir. El resultado que probamos fue coherente, la letra coincidió con el prompt, y la calidad de producción fue aceptable.

Esto es lo que Google, Suno y Udio pueden hacer con el mismo prompt:

Los problemas comienzan cuando se llevan las cosas al límite. Lyria 3 parece tener un rango de géneros cómodo que navega bien—pop, afrobeat, R&B, hip-hop ligero. Pero al probar prompts con estilos más específicos o inusuales, el modelo tuvo dificultades para mantenerse fiel a ellos. La guía de prompts de DeepMind lo reconoce implícitamente: está repleta de ejemplos para géneros mainstream y ofrece poca orientación para cualquier cosa fuera de esos parámetros.

Comparado con Udio, que al lanzarse en 2024 incluyó controles como un ajuste de "intensidad del prompt", un regulador de claridad para el ruido de fondo y prompts negativos para excluir sonidos o estilos específicos. O Suno, que ha estado generando canciones completas de varios minutos con estructura real—versos, coros, puentes—y es considerado el mejor modelo del sector. Ambas herramientas permiten generar pistas de formato largo que se sienten como canciones reales, no como samples. El límite de 30 segundos de Lyria 3 y su tendencia a desviarse de los prompts inusuales lo ubican en una categoría diferente.

También hay un contexto legal que vale la pena mencionar. Tanto Suno como Udio fueron demandados por la Recording Industry Association of America en 2024 por supuestamente haber entrenado sus modelos con grabaciones protegidas por derechos de autor sin permiso. Udio llegó a un acuerdo con Warner Music en noviembre de 2025 y está en proceso de transición hacia una plataforma completamente licenciada, que se lanzará en algún momento de 2026. El caso de Suno continúa.

Por su parte, Google afirma haber sido "muy cuidadoso con los derechos de autor y los acuerdos con socios" en el entrenamiento de Lyria 3, y el modelo evita deliberadamente imitar a artistas específicos—si nombras uno en un prompt, Lyria lo toma como inspiración de estado de ánimo y no como una instrucción directa.

En cuanto a seguridad y transparencia, todas las pistas generadas en Gemini vienen con SynthID integrado, la marca de agua imperceptible de IA de Google. La compañía también añadió verificación de audio a Gemini: puedes subir una pista y preguntar si fue creada por la IA de Google. Este tipo de herramienta de procedencia es cada vez más importante a medida que el audio generado por IA inunda las plataformas de streaming—Deezer ya implementó herramientas de detección para identificar y marcar streams falsos de música generada por IA.

Lyria 3 está disponible desde hoy en versión web para todos los usuarios de Gemini mayores de 18 años en inglés y un puñado de idiomas adicionales. La versión móvil se irá activando en los próximos días. Los suscriptores de Google AI Plus, Pro y Ultra obtienen límites de generación más altos. El modelo también amplía globalmente la función Dream Track de YouTube, anteriormente exclusiva para Estados Unidos, dando a los creadores de Shorts acceso a bandas sonoras generadas por IA para sus videos.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.