2011-08-04 37 views
41

¿Hay algo más por ahí, que se asemeje (en espíritu) a OpenCV, pero para procesar audio y derivar algo de inteligencia de él? Capacidades podrían oscilar entre: -¿Cualquier biblioteca C/C++ de tipo OpenCV para procesamiento de audio?

  1. captura de audio multiplataforma y reproducción de audio
  2. DSP - Filtros de audio
  3. la detección del tono
  4. análisis de la propiedad tonal
  5. síntesis
  6. Tone (diversas formas de onda estándar)
  7. Reconocimiento dado cierto corpus de reconocimiento y modelo (por ejemplo, determinar instrumentos musicales, ritmos, habla humana, etc.) - podría potencialmente utilizar otros proyectos de código abierto para la parte de reconocimiento real (esfinge)
  8. La síntesis de voz/música - podría ser de nuevo el uso de algunos otros proyectos de código abierto (fiesta)

Está bien si funciona la biblioteca de audio sobre S.T. prima la conversión de formato/codificación son problemas externos manejados por otras bibliotecas existentes (por ejemplo, de ffmpeg).

No soy un experto en este campo, pero necesito usar dicha API, y me pregunto si existen tales bibliotecas, por lo que mi elección de términos para determinar las capacidades probablemente no sea la mejor, por lo que los expertos pueden editar esta pregunta.

Respuesta

27

Para la captura y reproducción de audio, me viene a la memoria portaudio.

Para procesamiento de audio, STK parece prometedor.

Tener un vistazo a esta pregunta relacionada también: Can anyone recommend a decent DSP/speech library in C++?

recomiendo estos tres librerías:

  1. muy fácil de usar y amigable para el procesamiento de señales en general Aquila-dsp

  2. fuerte lib las procesamiento de señal de audio aunque difícil de usar y es muy grande y complicado para principiantes: CLAM Project

  3. otro No tengo experiencia al respecto, vale la pena considerarlo. tspl

+0

+1 por responder. STK parece ser principalmente una biblioteca de síntesis de música, pero puedo estar equivocado, ya que no he pasado suficiente tiempo con eso. – icarus74

+0

También encontrado libsox. Además de ese gstreamer, especialmente con los plugins ladspa tienen capacidades extensas. Sin embargo, no parece haber nada "todo bajo el mismo techo", como OpenCV. – icarus74

0

Creo que se puede tratar Gaudio sonido biblioteca - http://www.geek-audio.org

decodificación de audio soporte de la biblioteca Gaudio, codificación y dps.

5

Salida Essentia http://essentia.upf.edu/ Essentia es un código abierto biblioteca de C++ para el análisis de información de audio y de música basado en audio ... Contiene una amplia colección de algoritmos reutilizables que implementan la funcionalidad de entrada/salida de audio, bloques de procesamiento de señal digital estándar , caracterización estadística de datos y un amplio conjunto de descriptores de música espectrales, temporales, tonales y de alto nivel.

También hay una rama openFrameworks, aunque es posible que desee mantener hasta oficialmente 64 bits, C++ 11 en un par de meses. https://github.com/GiantSteps/Essentia-Libraries

Cuestiones relacionadas