Parece que la forma más sencilla e ingenua de hacer análisis de sentimientos básicos es con un clasificador bayesiano (confirmado por lo que estoy buscando aquí en SO). Cualquier contraargumento u otras sugerencias?Simple Sentiment Analysis
Respuesta
Un clasificador bayesiano con una bolsa de palabras representadas es el método estadístico más simple. Puede obtener resultados significativamente mejores pasando a clasificadores más avanzados y representación de características, a costa de una mayor complejidad.
Los métodos estadísticos no son el único juego en la ciudad. Los métodos basados en reglas que tienen una mayor comprensión de la estructura del texto son la otra opción principal. Por lo que he visto, estos no funcionan tan bien como los métodos estadísticos.
Recomiendo Manning y Schütze's Fundamentos del procesamiento del lenguaje natural estadístico capítulo 16, Categorización de texto.
No puedo pensar en una forma más simple e ingenua de hacer análisis de opinión, pero podría considerar usar una Máquina de vectores de soporte en lugar de Naive Bayes (en algunos kits de herramientas de aprendizaje automático, puede ser un reemplazo directo) . Eche un vistazo a "Thumbs up? Sentiment Classification using Machine Learning Techniques" by Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan, que fue uno de los primeros trabajos sobre estas técnicas, y proporciona una buena tabla de resultados de precisión en una familia de técnicas relacionadas, ninguna de las cuales es más complicada (desde la perspectiva del cliente) que ninguna de las demás.
Sobre la base de la respuesta proporcionada por Ken anterior, hay otro papel
"El análisis de sentimientos uso de máquinas de vectores de soporte con diversas fuentes de información" de Tony y Níger,
que se ve en la asignación de más funciones que simplemente una bolsa de palabras utilizada por Pang y Lee. Aquí, aprovechan wordnet para determinar la diferenciación semántica de los adjetivos, y la proximidad del sentimiento hacia el tema en el texto, como características adicionales para SVM. Muestran mejores resultados que los intentos previos de clasificar el texto en función del sentimiento.
- 1. Sentiment Analysis Dictionaries
- 2. Lista de herramientas de procesamiento del lenguaje natural en cuanto a Sentiment Analysis - ¿Cuál te recomiendas
- 3. C# Code Analysis CA2000
- 4. Software Development Analysis
- 5. Tutorial Web Capacity Analysis (WCAT)
- 6. WCF Trace Log analysis - help
- 7. Algoritmos para Big O Analysis
- 8. Analysis Services Only Autenticación de Windows
- 9. FxCop/Code Analysis con VS2010 Ultimate
- 10. MS Analysis Services OLAP API para Python
- 11. SQL Analysis Services OLAP TIME dimensión
- 12. Analizando la advertencia de FxCop/Code Analysis CA1506: AvoidExcessiveClassCoupling
- 13. Eclipse 3.7 C/C++ Code Analysis "codan" marcar errores falsos
- 14. SS Analysis Services (SSAS) Herramienta de comparación de esquemas DB?
- 15. ¿Por qué Code Analysis no advierte sobre NotImplementedException?
- 16. WPF - animación simple ejemplo simple
- 17. ¿Por qué obtengo Code Analysis CA1062 en un parámetro out en este código?
- 18. generación T4 simple para Simple POCO
- 19. simple división
- 20. Preg_replace simple
- 21. VS2010 Code Analysis, ¿hay alguna forma de corregir automáticamente ciertas advertencias?
- 22. ¿Cómo uso MySQL como origen de datos en Microsoft SQL Server Analysis Services?
- 23. Visual Studio 2010 Code Analysis CA1305 (Specify IFormatProvider) regla no funciona para TryParse métodos
- 24. Cómo usar StringWriter y HtmlWriter juntos sin advertencias de Code Analysis
- 25. ¿Se puede hacer que Code Analysis entienda los contratos de código?
- 26. La mejor forma de acceder al Cubo de MS Analysis Services desde Java
- 27. ¿Cómo obtener FxCop tiene el mismo conjunto de reglas que el de Visual Studio Code Analysis?
- 28. No se puede conectar a SQL Server Analysis Services aunque parece estar ejecutándose
- 29. ¿Por qué mi código es más rápido cuando se ejecuta con Performance Analysis?
- 30. ¿Cómo ejecutar Visual Studio Code Analysis desde la línea de comando?
Ese es un buen comienzo. Más tarde, Pang & Lee tuvo otro documento que aborda el problema de forma ligeramente diferente para obtener un mejor resultado. Pruebe esto: http://www.aclweb.org/anthology-new/P/P04/P04-1035.pdf – mixdev