2009-06-02 16 views
13

Me gustaría crear una aplicación que use reconocimiento de voz. He visto grandes empresas como Google, etc. implementar esta característica, pero tengo curiosidad por hacerlo en un nivel de puesta en marcha. ¿Alguien miró esto? ¿Hay alguna herramienta para que hagamos esto?iPhone App> ¿Agregar reconocimiento de voz?

+1

creo que es necesario proporcionar más detalles - lo que desea la aplicación para hacer, etc ... – zpesk

+0

Si usted está buscando para el anuncio de voz a texto de control para su iPhone a continuación, leer este hilo http://www.surreystore.com/cms/technology/7-apple/16-how-to-add-voice-to-text-for-iphone.html – iMacker

Respuesta

3

El mejor enfoque será probablemente a:

  1. Grabar la voz en el teléfono
  2. enviar la grabación a un servidor que ejecuta el software de reconocimiento de voz
  3. A continuación, devolver algo al teléfono para indicar lo que debe hacer
+2

Eso es una gran cantidad de datos para enviar. Podría probarlo en el iPhone. Después de todo, las PC podrían hacer un trabajo justo de esto hace 10 años, entonces quizás los iPhones deberían poder hacerlo ahora. – Nosredna

+3

Esta es en realidad la técnica en la que la aplicación de Búsqueda de Google usa – bgw

+0

Google codifica la voz de una manera especial, no solo envían los datos de audio en bruto exactamente por la razón que nos dio Nosredna. –

4

Si se inicia aquí en wikipedia, obtendrá una buena lista de motores (http://en.wikipedia.org/wiki/Speech_recognition#Commercial_software.2Fmiddleware)

Mientras escribo esto (24 de junio de 2009) A mi me parece que son dos soluciones de código abierto viables

Ambos tienen se ha usado en aplicaciones de iphone, pero la fuente amigable para iphone no está disponible.

Al editar esto (8 de julio de 2009) recientemente descubrí que Loquendo (http://www.loquendo.com/en/) tiene reconocimiento de voz y síntesis de voz (ASR & TTS) para el iphone.

+0

@Rohrer, Will Apple aprobará esto si agregamos cualquier motor externo para el reconocimiento de voz – smakstr

+0

@Shibin - Nunca he escuchado que tales aplicaciones sean rechazadas, y tampoco esperaría que lo fueran, pero su kilometraje puede variar . Siempre puede buscar usuarios de un SDK en particular y asegurarse de que sus aplicaciones se estén publicando realmente. Esto sería particularmente fácil con los sdks comerciales. –

0

El Dragon Mobile SDK de Nuance hace lo que se solicita. Necesita una conexión a Internet para poder enviar el audio al servidor de Nuance y obtendrá una lista de respuestas de texto. A continuación, puede decidir qué hacer con las respuestas de texto (por ejemplo, solicite a su usuario que elija la que quiere decir o realice alguna acción). Aquí está el enlace:

http://dragonmobile.nuancemobiledeveloper.com/

Cuestiones relacionadas