Meta presentó MusicGen, un modelo de inteligencia artificial (IA) de fácil uso que puede generar música de alta calidad a partir de una descripción breve en texto y una melodía.
MusicGen es un modelo simple de lenguaje, desarrollado bajo un enfoque de una sola etapa con patrones de tokens eficientes entrelazados, con EnCodec audio de 32Khz, que reduce la necesidad de conectar en cascada varios modelos, como explican los investigadores de ‘Audiocraft‘.
A partir de esta modalidad, MusicGen genera muestras de música de alta calidad de unos 12 segundos de duración, con solo introducir una breve descripción en texto y una referencia de la melodía que se busca obtener.
La compañía tecnológica publicó en el portal Hugging Face AI este 12 de junio de 2023, una demostración de MusicGen, con la que cualquier usuario puede generar una muestra de música.
Añade, también, una serie de ejemplos de las descripciones, en algunos casos acompañados de descripción melódica.
Los investigadores utilizaron para el entrenamiento más de 20 000 horas de música con licencia, incluidas 10 000 pistas de alta calidad procedentes de una base de datos interna y datos sacados de Shutterstock y Pond5.