Tengo 15 cintas de audio, una de las cuales creo que contiene una vieja grabación de mi abuela y yo hablando. Un intento rápido de encontrar el lugar correcto no lo subió. No quiero escuchar 20 horas de cinta para encontrarlo. La ubicación puede no estar al comienzo de una de las cintas. La mayor parte del contenido parece pertenecer a tres categorías, en orden de duración total, la más larga primero: silencio, voz de radio y música.Código fuente abierto para detección y discriminación de voz
Planeo convertir todas las cintas al formato digital, y luego buscar nuevamente la grabación. La forma obvia es jugarlos todos en el fondo mientras hago otras cosas. Eso es demasiado sencillo para mí, así: ¿Hay bibliotecas de código abierto, u otro código, que permitirían que encuentre, con el fin de aumentar la sofisticación y utilidad: regiones
- no silencioso
- Las regiones que contienen el habla humana
- Las regiones que contienen mi propia voz (y la de mi abuela)
mi preferencia es para Python, Java o C
respuestas fallando, h Se apreciarán los términos de búsqueda ya que no sé nada sobre el campo.
Entiendo que fácilmente podría pasar más de 20 horas en esto.
1 para "entiendo que fácilmente podría pasar más de 20 horas en esto ". –
Su última línea hace referencia a [este cómic] (https://xkcd.com/1319/) tan apropiado aquí. – jjj