¿Localizar archivos de audio similares en su sistema basándose en el contenido espectral? (Sonido, Audio, Osx, Organización De Archivos, Búsqueda, Editor De Audio)

RustyDev preguntó.

Estoy buscando un software editor de OSX que pueda tomar un archivo de entrada y encontrar archivos de sonido similares en mi sistema basado en su contenido espectral.

¿Alguna sugerencia?

Comentarios

  • Tendrías que escribirlo. No es una tarea muy difícil. hay que leer cada archivo y poner las frecuencias en una tabla, cuanto más complejos sean los análisis más lenta será la búsqueda. luego hay que comparar esa melodía con todas las demás de la tabla. Un buen programador de audio para OSX tardaría unos 10 días en completar una simple versión beta. Hay un programa que puede decir la información de la armonía de las melodías para dj’s no sé su nombre y es caro, lo hace bpm y la clave de la raíz, etc, no espectral sin embargo. –  > Por Aliential.
4 respuestas
José David

La dificultad del problema planteado es que el «contenido espectral» no es sólo un número que puedes comparar para encontrar grados de proximidad. Hay que disponer de complejos algoritmos de análisis, comparando múltiples parámetros en función de la aplicación prevista, y definir criterios de proximidad, normalmente basados en métodos estadísticos. Esto es cierto incluso para sonidos relativamente «simples» (muestras de instrumentos musicales, o sonidos naturales cortos, por ejemplo), si el sonido es demasiado heterogéneo a lo largo del tiempo, la tarea es casi imposible y/o carece de sentido.

Así que, en teoría, podría haber (y tal vez lo haya, no lo sé) una herramienta preparada para hacer, dentro de ciertas limitaciones y campo de aplicación, el tipo de catalogación y búsqueda descrito en la pregunta. Pero lo que se puede encontrar más fácilmente (normalmente en el ámbito de la investigación académica y científica) son recursos y herramientas que permitan construir una herramienta de este tipo que se adapte a las necesidades específicas de cada uno tras (normalmente mucho) tiempo de experimentación y puesta a punto.

Una de estas herramientas es Essentia, una biblioteca C++ de código abierto muy potente para el análisis de audio y la recuperación de información musical basada en el audio. Esta biblioteca tiene funciones para evaluar docenas de propiedades diferentes de los espectros de sonido. Un vistazo a la página de página de descripción de los algoritmos, en particular a las funciones MIR (Musical Information Retrieval), para hacerse una idea de las diferentes propiedades del audio que pueden ser consideradas.

Esta pregunta en Music.SE también puede ayudar a entender el enfoque de este tipo de problema.

he_artburns

Algunos programas de DJ dicen ofrecer algoritmos de coincidencia de claves para sugerir canciones, así que si cargas tu biblioteca musical en Traktor y otros, pueden o no hacer algo parecido. Eso es si quieres decir armónico como en Harmony, en lugar de armónicos que crean timbre

Comentarios

  • Gracias, dije incorrectamente armónico cuando quería decir espectral y actualicé mi pregunta. Hay funciones similares en algunos sintetizadores para encontrar parches de sonido similares. Me gustaría tomar un bombo, y encontrar archivos similares en mi biblioteca de muestras basadas en él. ¿Tiene sentido? –  > Por RustyDev.
  • Ahora sí tiene sentido, pero no conozco ninguna herramienta, ¡lo siento! Parece que se necesitaría un algoritmo sofisticado… o bien el algoritmo devolvería todos los demás bombos, o bien tendría que afinarse de forma diferente dependiendo de si se está introduciendo un bombo o una cuerda o un cuerno o un kazo… –  > Por he_artburns.
Marc W

Para hacer eso, el software tendría que leer todos y cada uno de los archivos de audio, creo que esto sería poco práctico, a menos que hubiera un escaneo inicial, que tomara tiempo para escanear todos los archivos de audio, creara el/los correspondiente/s archivo/s de información espectral para consultar cada vez que se hiciera una búsqueda. No conozco nada parecido, la mayoría depende de las etiquetas, creo.

Los parches de sintetizador serían diferentes, probablemente busquen parámetros similares (y por lo tanto, sonidos) lo que es mucho más rápido (ya que no son archivos de audio). Dicho esto, estoy seguro de que también utilizan etiquetas.

RustyDev

Las cosas han avanzado mucho en los últimos años con respecto a la búsqueda de sonidos similares en una biblioteca de muestras.

XO

Atlas

Sononym