2009-01-29 15 views
39

¿Cómo podría tomar MP3 y convertir la voz en texto?¿Cómo convierto el discurso a texto?

Tengo algunas notas grabadas de una conferencia y de reuniones (hay una sola voz en la grabación, que es mi voz). Pensé que sería más fácil e intelectualmente interesante convertir a texto usando herramientas de voz a texto en lugar de simplemente transcribir a mano. Sé que existen tecnologías, especialmente para aplicaciones de VoIP que usan Asterisk y Podcasts, pero ¿qué son y cómo puedo usarlas?

+0

Quizás pase esto a Joel y Jeff para que puedan obtener el texto para sus transcripciones wiki de los podcasts SO. –

+0

Como solución alternativa, uno puede cargar los medios a Youtube como un video, ya que Youtube realiza el servicio CC cuando se sube un video. No es la solución de un desarrollador, pero puede pasar desapercibida. https://www.youtube.com/watch?v=yxmfJuC2Uno – iamtoc

Respuesta

30

Open Source: CMU Sphinx

shareware: http://www.e-speaking.com/ (Windows)

Comercial: Dragon NaturallySpeaking (Windows)

+0

Creo que los tres anteriores son buenas opciones para darte lo que necesitas para empezar, pero habrá algo de codificación (no cortar ni pegar hack) para hablar sobre el trabajo de texto. Desde mi experiencia muy limitada de usar Sphinx con Asterisk PBX, me gustaría ir a por el voto libre (cerveza y discurso) para un pequeño proyecto personal. –

5

.NET puede hacerlo con su espacio de nombres System.Speech.

Tendría que convertir a .wav primero o capturar el audio en vivo desde el micrófono.

detalles sobre la aplicación se pueden encontrar aquí: Transcribing Audio with .NET

0

tarde a la fiesta, por lo que responder más para referencia futura.

Los avances en el campo + mentalidad y la agenda de Mozilla llevado a estos dos proyectos con ese fin:

Este último tiene un 12 GB-set de datos para su descarga. El primero le permite entrenar un modelo con sus propios archivos de audio, a mi entender

Cuestiones relacionadas