2012-05-28 17 views
5

Buen día, Estoy intentando escribir una aplicación de análisis sentimental en python (usando el clasificador naive-bayes) con el objetivo de categorizar frases de noticias como positivas o negativas. Y estoy teniendo problemas para encontrar un corpus apropiado para eso. Intenté usar "General Inquirer" (http://www.wjh.harvard.edu/~inquirer/homecat.htm) que funciona bien pero tengo un gran problema allí. ya que es una lista de palabras, no una lista de frases que observo el siguiente problema cuando se trata de etiquetar la siguiente frase:Frase corpus para análisis sentimental

No se espera que gane.

Esta frase se clasifica como positiva, lo que es incorrecto. La razón de esto es que "ganar" es positivo, pero "no" no tiene ningún significado ya que "no ganar" es una frase. ¿Alguien puede sugerir un corpus o una solución alternativa para ese problema? Su ayuda y comprensión es muy apreciada.

+0

Como nota al margen: ¿Espera Bayes ingenuo para trabajar aquí? Digamos que todas nuestras características son "ganar", "perder" y "no", y "ganar" y "perder" aparecen en proporciones iguales. Entonces, ya sea "ganar" o "no ganar" se clasificarán erróneamente. –

+0

Creo que es por eso que pregunta sobre el uso de frases como características. – phs

+0

Creo que está usando palabras como características para clasificar frases ... –

Respuesta

4

Véase, por ejemplo: "Lo bueno y lo que no lo es: aprender a clasificar el alcance de la negación para el análisis de opiniones mejorada" por Councill, McDonald, y Velikovich

http://dl.acm.org/citation.cfm?id=1858959.1858969

y seguimientos,

http://scholar.google.com/scholar?cites=3029019835762139237&as_sdt=5,33&sciodt=0,33&hl=en

por ejemplo por Morante et al 2011

http://eprints.pascal-network.org/archive/00007634/

+0

Gracias Georgy. Definitivamente echaré un vistazo. – TE0

3

En este caso, el trabajo no modifica el significado de la frase expecteed para ganar, darle la vuelta. Para identificar esto, necesitaría etiquetar POS la oración y aplicar el adverbio negativo no a la frase verbal (creo) como una negación. No sé si hay un corpus que le diga que no sería este tipo de modificador o no, sin embargo.

+1

Me encanta su uso con un alcance muy diferente de la palabra "no" cerca del final de eso. ¡Buena suerte a todos nuestros algoritmos para descubrir lo que eso está negando! :-) –

Cuestiones relacionadas