2011-09-22 17 views

Respuesta

9

Hay un grupo de bibliotecarios IOS comerciales para reconocimiento de voz. Los nombres que sigo escuchando son Nuance, iSpeech y Yapme. Cada uno ofrece reconocimiento de voz en la nube (fuera del dispositivo) y una biblioteca de cliente y SDK para incorporar a su aplicación.

Nuance parece apoyar Español - http://blog.dragonmobileapps.com/2011/01/mobile-app-developer-dragon-mobile-sdk.html

... puedes discurso a habilitar su aplicación para la inclusión de los Estados Unidos y el Reino Unido Inglés, europea español, europeo francés, alemán, italiano y japonés --- con ¡aún más idiomas disponibles para 2011!

y ahora Nuance ofrece a los desarrolladores acceso gratuito - http://www.masshightech.com/stories/2011/09/26/daily13-Nuance-tweaks-mobile-dev-program-with-free-access-to-Dragon.html

iSpeech es probable que apoyen español - http://www.ispeech.org/developers/iphone

SDK móviles de iSpeech soporte 27 TTS y ASR (gramática definida) idiomas y 15 idiomas para el reconocimiento de voz de dictado de forma libre.

Yapme, lo siento, no estoy seguro - http://yapinc.com/speech-cloud.html

4

Echa un vistazo aquí: http://src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech/

Es la navegador Chrome de voz para buscar ...... que puede hacerlo en Objective-C. Prueba google.com en el navegador Chrome y si se reconoce español, ¡tú ganas! :)

Usted puede utilizar fácilmente:

- (void) SpeechFromGooglezzz { 
    NSURL *url = [NSURL URLWithString:@"https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=en-US"]; 

    ASIFormDataRequest *request = [ASIFormDataRequest requestWithURL:url]; 
    NSString *filePath = [NSString stringWithFormat:@"%@%@", [[NSBundle mainBundle] resourcePath], @"tmpAudio.flac"]; 

    NSData *myData = [NSData dataWithContentsOfFile:filePath]; 
    [request addPostValue:myData forKey:@"Content"]; 
    [request addPostValue:@"audio/x-flac; rate=16000" forKey:@"Content-Type"]; 
    [request startSynchronous]; 

    NSLog(@"req: %@", [request responseString]); 
} 

Recuerde que debe grabar un archivo FLAC tasa de bits 16000! ¡O nada!

Google responde con un json que contiene las palabras.

Espero que esto ayude.

+0

Según tengo entendido, Google no proporciona estos servicios para uso comercial, excepto para los clientes de Chrome y Android. No construiría una aplicación comercial usando esas API de IOS. Google podría cerrar fácilmente tu aplicación. Si solo se trata de un prototipo o experimento, puede salirse con la suya con el uso de los servicios de Google, pero no confiaría en ellos para fines comerciales. –

+0

¡Correcto, pero Fernando no especificó si la aplicación es comercial o no! :) – elp

+0

Cierto, un buen enlace para ver es http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ –

1

He escrito una biblioteca de cliente para las API de Google Speech. Funciona mejor con iOS y también es compatible con otros sistemas Unix:

Editar: Prueba aquí: https://github.com/H2CO3/libsprec

Cuestiones relacionadas