Necesito herramientas de reconocimiento de texto a voz y voz para Linux

Planeo escribir un programa para Linux que use el reconocimiento de texto a voz y voz. ¿Cuáles son las mejores herramientas/bibliotecas para esto? ¿Debería usar Windows para poder usar mejores herramientas? Las herramientas deben poder llamarse fácilmente desde una consola o programa C.Necesito herramientas de reconocimiento de texto a voz y voz para Linux

Fuente

2009-05-18 Cory Walker

Para el reconocimiento de voz existen varios Sphinxes. Las diferentes variantes tienen diferentes pros y contras, hay una comparación aquí Comparison of Sphinx versions. Sphinx 4 es Java, pero los otros son C, creo.

Fuente

2009-05-18 13:53:57

-1

Sé espeak es un muy buen programa de texto a voz para Linux (incluso puede hacer diferentes acentos!), Pero no conozco ningún sistema de reconocimiento de voz diseñado para UNIX.

Fuente

2009-05-18 12:35:25

He usado tanto Loquendo como Festival en linux. Consideraría las voces del festival que utilicé bastante pobres, con síntesis muy robótica. Las voces de Loquendo, por otro lado, son excelentes, de muy alta calidad.

Fuente

2009-05-18 13:15:17 mysomic

Si se va a utilizar Festival, debe instalar las voces alternas. Las instrucciones (para debian/ubuntu) están aquí: http://ubuntuforums.org/showthread.php?t=677277 –

¿Cómo fue tu experiencia con Loquendo? Si está dispuesto, me gustaría hacerle un par de preguntas al respecto por correo electrónico. – philfreo

Para reconocimiento de voz, existe muy poco para linux. Solo estaba al tanto de una opción aparentemente decente, algo que IBM lanzó hace algunos años pero que luego dejó de estar disponible (¿alguien sabe si este ViaVoice SDK todavía es posible de conseguir desde cualquier lugar?). Hay más información sobre las opciones posibles en wikipedia.

Fuente

2009-05-18 13:46:57 hlovdal

ViaVoice SDK. Nunca estuvo en pleno lanzamiento, y los documentos exigían un rango bastante estrecho sobre los números de versión del kernel 2.4. Lo jugué para quitarme algo de tipeo cuando tenía tedonitis intermitente en las muñecas, pero no tuve suerte ... – dmckee

Depende bastante de qué discurso está tratando de reconocer.

Este es un artículo de 2005 que explica algunas de las dificultades para crear un programa de dictado: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html. Si lo desea, el motor de reconocimiento de voz Julius parece prometedor, pero deberá agregar sus propios modelos acústicos y de lenguaje. Es posible que pueda utilizar el modelo acústico voxforge.

Si no está tratando de escribir un programa de dictado, entonces tiene una tarea mucho más fácil. Los programas de comando tienen vocabularios limitados, por ejemplo 'Si desea continuar en inglés, diga' Inglés ''.

que fue capaz de obtener muy buenos resultados utilizando pocketsphinx y gstreamer para hacer a program que edita automáticamente la mayoría de las apariciones de la palabra "twitter" fuera de la TWiT podcast. No funcionó en absoluto hasta que utilicé mi propio modelo de lenguaje basado en las transcripciones del podcast; las transcripciones de la máquina del reconocedor de voz son inútiles/hilarantes, pero hacen un buen trabajo al encontrar la palabra clave.

Fuente

2009-05-18 14:01:00 joeforker

¿tienes alguna experiencia con el uso de pocketsphinx y gstreamer con tcpserversrc/client? – si28719e

no, pero gstpocketsphinx + tcpserversrc/sink no debe ser diferente de cualquier otro elemento gstreamer + tcpserversrc/sink. – joeforker

parece que el enlace a su programa "twitterkiller" está roto. –

-1

en & t kit de herramientas FSM también es bastante impresionante - no al uso comercial permitido, sin embargo,

http://www.research.att.com/~fsmtools/fsm/

Fuente

2009-08-26 14:55:38 si28719e

-1

Esto es un poco viejo, pero vi que una guía bastante completa sobre el reconocimiento de voz en Hackaday unos días hace: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/

Fuente

2010-07-11 22:24:35

-1

http://simon-listens.org/ - programa de código abierto reconocimiento de voz/voz Simon

Fuente

2011-01-04 13:34:11

-1

y TH es hay mbrola para texto a voz.

Fuente

2011-01-04 13:40:14 user562374

-2

La pregunta original era acerca de encontrar bibliotecas adecuadas, lo sé, pero desde el punto de vista del uso de reconocimiento de voz lo suficientemente bueno para el dictado real, parece que no hay nada para Linux (aunque estoy seguro de que cambiará a tiempo, Sospecho que tomará un tiempo, ya que no estoy seguro de que muchas personas estén interesadas).

En el momento que estoy tratando de promover Dragon NaturallySpeaking como un producto con el apoyo de CodeWeavers ... así que si usted está interesado como un usuario que ayudaría si desea emitir un voto ...

http://www.codeweavers.com/compatibility/browse/name/?app_id=8427

Fuente

2011-03-24 00:30:59 David

-1

¿Ha comprobado la síntesis de voz basada en HMM para texto a voz. Puede encontrar la demo gratuita en el sitio web http://hts.sp.nitech.ac.jp/. La instalación será un poco tediosa.

Fuente

2014-03-31 12:22:03 se7en

para Debian/Ubuntu de texto-a-voz también hay SVOX Pico:

sudo apt-get install libttspico-utils

Fuente

2014-08-13 13:24:38

Necesito herramientas de reconocimiento de texto a voz y voz para Linux

Respuesta

Cuestiones relacionadas