Tengo un cliente que necesita una aplicación de Android que pueda reconocer los comandos hablados. Por lo que entiendo, la función incorporada de voz a texto en realidad envía datos a los servidores de Google que luego envían una traducción de texto. Este es un problema importante, ya que los datos de voz son extremadamente sensibles (a menos que los datos se cifren cuando se envían desde y hacia Google, pero dudo que estén encriptados).Puede CMU Sphinx configurarse para reconocer ~ 200 palabras
Hay 2 opciones que se me ocurren. Lo primero es convertir voz a texto en Android, aunque parece que sería una operación extremadamente costosa. La segunda posibilidad es hacer que un servidor local convierta los datos por mí (podría encriptar los datos de voz y la traducción cuando se envíen ay desde). ¿Es esto algo que CMU Sphinx podría lograr? Vale la pena señalar que también tendré acceso a un servidor de Asterisk, lo que podría ayudar con esto (no sé).
En realidad, sólo debe haber ~ 200 palabras que necesitan ser reconocidas. Preferiría soluciones de software libre/de código abierto; sin embargo, también estoy abierto a una solución comercial (tal vez FlexT9). Idealmente, puedo enviar la transmisión de audio a alguna parte, recuperar una Cadena que es el texto, y luego puedo analizar y hacer otras cosas con la Cadena.
no he hecho mucho androide o cualquier desarrollo de reconocimiento de voz en el pasado, así que espero que alguien pueda al menos me punto en la dirección correcta. ¡Gracias!
¿Está disponible la solución de Microsoft para Android (la que está sugiriendo) también? – srf
Es solo un componente del lado del servidor. Tendría que crear su propia implementación de cliente para capturar el audio y enviarlo al servidor. –