AudioGen es una IA que genera sonido a partir de texto. (Foto: Freepik, kjpargeter)
AudioGen es una IA que genera sonido a partir de texto. (Foto: Freepik, kjpargeter)
Redacción EC

La no deja de sorprender y, si pensabas que ya los habías visto todo con generadores de imágenes y video, ahora llegó AudioGen, una IA que crea sonidos a partir de órdenes textuales.

DALL-E 2 y Midjourney han demostrado lo impresionantes que son para crear arte a partir de texto, mientras que Meta y Google han estrenado sus propios productos de IA que generan videos. Ahora, investigadores de Meta y de la Universidad Hebrea de Jerusalén introducen AudioGen, una IA que genera sonidos.

MIRA: Google lanza su propia IA para crear videos a partir de descripciones de texto

Silbido con viento de fondo” o “Un hombre habla mientras pájaros cantan y perros ladran” son algunas de las órdenes que AudioGen sigue para crear sonidos muy realistas, tal como presentó Felix Kreuk, del equipo de investigadores, a través de su cuenta de Twitter.

En su artículo académico, el equipo explica que AudioGen consiste en un modelo autorregresivo de generación de audio basado en textos.

MIRA: Las increíbles imágenes que creó una IA con la frase: “Miguel Grau en el Huáscar durante la Guerra del Pacífico”

Según los investigadores, AudioGen puede distinguir entre diferentes tipos de ruidos y separarlos entre ellos; por ejemplo, puede filtrar dos personas hablando al mismo tiempo. De esta manera, las muestras generadas pueden ser editables y más precisas.

El proyecto utilizó 10 conjuntos de datos para que la IA pueda aprender sobre distintos sonidos. Aunque aún está en desarrollo, el equipo planea lanzar AudioGen al público general, para lo cual compartirán el código en GitHub.

MIRA: ¿Qué hizo Steve Jobs para no llevar una placa en su auto sin incumplir la ley?

Las IA generadoras de imágenes y videos ya se han hecho un espacio entre los usuarios, quienes experimentan con estas herramientas a diario con increíbles resultados. Diario El Comercio incluso ha probado de lo que son capaces inteligencias artificiales como Midjourney y DALL-E 2 para .

Contenido sugerido

Contenido GEC