20

estoy desarrollando un sitio web, y me gustaría ayudar a las personas ciegas a lo utilizan por la voz, así que voy a utilizar:JavaScript de voz a texto para personas ciegas

  • texto-a-voz , para dar algunas posibilidades para el usuario
  • de voz a texto, para permitir al usuario utilizar su voz para seleccionar uno

ya tengo algo de JavaScript bibliotecas de conversión de texto a voz (como speak.js), pero ahora necesito un buen discurso a texto. Hay algunas soluciones para este propósito (como speechapi), pero usan Java Applets o Flash, y quiero depender solo de JavaScript, para evitar complementos.

Estoy tratando la entrada de voz de HTML5 con x-webkit-speech y Google Chrome, y está bien, pero debe hacer clic sobre un ícono (y las personas ciegas no pueden usar bien el mouse). ¿Es posible usar x-webkit-speech presionando una tecla? ¿Conoces alguna API alternativa (JavaScript)?

¡Gracias!

+0

+1 excelente pregunta – Blaster

+3

¿No debería la navegación por voz ser parte del navegador, en lugar del sitio web? – Bergi

+1

@Bergi La navegación podría ser una responsabilidad del navegador, pero mi sitio web es más complejo. Tiene juegos simples para mejorar las capacidades de tu cerebro, y mi intención es adaptar algunos de ellos a personas ciegas, para que el navegador no pueda administrar mis juegos de HTML5. – sgmonda

Respuesta

2

Google Translate es muy bueno Text To Speech Engine. Solía ​​leer un texto con eso. Por ejemplo, usted tiene un texto: welcome to Stack overflow puede llamar como esto

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input 

continuación, utilizar el audio del navegador para reproducirlo

para la entrada de voz se puede activar manual del proceso de escuchar, ver aquí http://code.google.com/chrome/extensions/experimental.speechInput.html

+0

Pero luego, el usuario necesitaría instalar una extensión para Chrome. Es una posibilidad, pero no me gustaría depender de una extensión. Lo ideal es que el usuario solo tenga que abrir su navegador (ahora, Chrome es el único que admite entradas de voz, pero esto está en la especificación de HTML5, por lo que todo el navegador lo admitirá con el tiempo) – sgmonda

3

¿Es posible usar x-webkit-speech presionando una tecla?

De acuerdo con este post y este post no puede anular el inicio del discurso haciendo clic en el micrófono.

Lo que está haciendo x-webkit-speech es usar las capacidades de captura de audio de HTML5 y enviar el audio a los servidores de Google para su procesamiento, devolviendo los resultados en JSON. Esto blogger has reversed engineered it. Puede desarrollar una biblioteca de JavaScript que busque presionar una tecla para comenzar a capturar audio en navegadores compatibles con HTML5 y enviarlo al servicio de Google o al que haya creado. La desventaja de usar el servicio de Google es que es una API no compatible y está sujeta a cambios en cualquier momento. La desventaja de desarrollar su propio servicio es que puede ser costoso de desarrollar y mantener.

¿Conoces alguna API alternativa (JavaScript)?

Este post y este post enumeran algunos servicios disponibles para reconocimiento de voz. No vi a Nuance en la lista. Puede usar el Dragon Mobile SDK para esto. Y es posible que desee comprobar en ISpeech.