Stable Audio 3.0: la IA que te hace canciones completas en segundos ya está aquí

La compañía detrás de Stable Diffusion lanza una familia de modelos de código abierto que generan pistas de hasta seis minutos y medio con estructura musical coherente. La licencia comunitaria permite comercializar lo que crees, siempre que factures menos de un millón de dólares.

Stability AI acaba de soltar Stable Audio 3.0, y si pensabas que lo de generar imágenes con un prompt era el límite, prepárate: ahora te hace canciones completas en segundos. No, no es un filtro de TikTok ni una app para el móvil. Es una familia de modelos de IA capaces de producir pistas de hasta seis minutos y medio con una estructura musical que no se desmorona a los veinte segundos. Y tres de ellos vienen con pesos abiertos.

Cuatro sabores de IA musical, del móvil al centro de datos

La familia se divide en cuatro versiones. La más pequeña, Small SFX, está optimizada para efectos de sonido y corre directamente en un portátil o un teléfono. El modelo Small (459 millones de parámetros) ya compone canciones enteras, también en local. El Medium (1.400 millones de parámetros) sube la apuesta con pistas de hasta seis minutos y veinte segundos, y es uno de los tres que puedes descargar ya desde Hugging Face.

El tope de gama es Large, con 2.700 millones de parámetros. Este solo se sirve vía API o en plataformas de pago, pensado para empresas que necesiten generar audio a gran escala. La diferencia clave no es solo la duración: el autocodificador semántico-acústico que llevan dentro permite especificar la longitud exacta al segundo, sin casarse con los bloques rígidos de antes.

Publicidad

Licencia abierta y sin miedo a las demandas (por fin)

La pesadilla legal de Stable Diffusion enseñó a la compañía algo importante. Para esta familia, todos los modelos se han entrenado con datos licenciados, en colaboración con Warner Music Group y Universal Music Group. Así se blindan contra los frentes judiciales que tanto ruido hicieron en el mundo de la imagen sintética.

La licencia comunitaria de Stability AI permite distribuir y comercializar lo que generes con los modelos abiertos, siempre que factures menos de un millón de dólares al año. Si superas esa cifra, toca pasar por caja y negociar una licencia empresarial. El código abierto tiene letra pequeña, pero al menos es legible.

¿Qué hemos aprendido de Stable Diffusion y compañía?

Como precedente, la explosión de Stable Diffusion en 2022 fue un terremoto para los creadores visuales: de repente cualquiera podía ilustrar un cómic con cuatro palabras. Pero llegaron las demandas por derechos de autor, los debates éticos y la sensación de que la barra libre no era tan libre. Ahora Stability AI ha cogido ese guion, lo ha doblado y ha decidido jugar con las reglas de la industria discográfica desde el minuto uno.

La maniobra es inteligente: entrenar con datos licenciados y amarrar acuerdos con las grandes discográficas puede ser la única vía para que la IA musical no acabe en los tribunales. El resultado es un modelo que suena bien y que, además, no te va a meter en un lío legal si lo usas para hacer una sintonía para tu podcast. La pregunta abierta es si los músicos verán esto como una herramienta más o como otra zancadilla. Probablemente, igual que con las imágenes, la respuesta será un poco de las dos cosas.

Hype-O-Meter

Nivel de hype: 8/10. La calidad de las muestras preliminares es notable y la apertura de pesos lo convierte en un laboratorio para desarrolladores y artistas. Pero el verdadero test llegará cuando la comunidad empiece a entrenar sus propios LoRA y veamos si el modelo aguanta el contacto con la realidad — o si empieza a soltar alucinaciones armónicas a los tres minutos y medio.

El resumen para vagos (TL;DR)

  • 🎯 ¿Qué ha pasado? Stability AI ha lanzado Stable Audio 3.0, una IA que genera canciones de hasta seis minutos y medio con estructura coherente.
  • 🔥 ¿Por qué importa? Tres de los cuatro modelos son de código abierto y se entrenaron con datos licenciados, lo que podría evitar el culebrón legal de otras IA.
  • 🤔 ¿Nos afecta o es solo un meme? Si haces música, lo tienes en Hugging Face gratis. Si no, es otra vuelta de tuerca de la IA generativa que da un poco de vértigo y bastante curiosidad.