¿Hay alguna manera de clasificar una oración/párrafo en particular como gracioso? Hay muy pocos indicadores sobre dónde se debe ir más allá en esto.NLP clasifica oraciones/párrafo como gracioso
Respuesta
Hay una investigación sobre esto, se llama Computational Humor. Es un área interdisciplinaria que toma elementos de la lingüística computacional, la psicolingüística, la inteligencia artificial, el aprendizaje automático, etc. Intentan descubrir qué es lo que hace que las historias o bromas sean divertidas (por ejemplo, la conexión inesperada o el uso de un tema tabú de una manera sorprendente etc.) y aplicarlo al texto (ya sea para generar una historia divertida o para medir el "sentido del humor" del texto).
Hay books y artículos sobre esto (por ejemplo, Graeme Ritchie).
La única manera de lograrlo es conseguir que un par de miles de personas (los monos no lo hagan, lo siento) que miren miles de oraciones/historias divertidas, las califiquen y luego construyan algún tipo de sistema experto/red neuronal fuera de él. Dado el alcance del problema y la subjetividad (una cosa graciosa para una persona puede no ser divertida, incluso ofensiva para otra), diría que es una tarea imposible.
Sí, debe usar un Cuerpo de entrenamiento para construir un modelo predictivo capaz de detectar oraciones divertidas. A veces esto se conoce como "Análisis de sentimiento" en la literatura. Eche un vistazo a este artículo sobre Sentiment Analysis with LingPipe.
Si puede usar Java, puede usar su biblioteca (consulte license matrix). Lo encontré muy útil, no exactamente en el mismo contexto que tú.
Puede utilizar la misma técnica que los filtros de correo no deseado. En lugar de spam/no spam clasificas en divertido/no divertido. Mire en los clasificadores bayesianos ingenuos para más información.
Además, trate Computational Humor @ Google Scholar si usted es serio sobre conseguir en el campo. El análisis del sentimiento también se mencionó, vea wikipedia en eso.
Por supuesto, todo esto depende de lo que su alcance y objetivos son ...
- 1. Marco NLP para .NET
- 2. ¿Cómo clasifica .NET caracteres especiales?
- 3. stanford nlp tokenizer
- 4. biblioteca c/C++ NLP
- 5. ¿Cómo se clasifica con Data.Vector.Generic.Mutable?
- 6. Generando preguntas del texto (NLP)
- 7. stanford core nlp java output
- 8. ¿Cómo clasifica Python una lista de tuplas?
- 9. ¿Cómo clasifica el servidor SQL sus datos?
- 10. ¿Cómo se clasifica el método LINQ .distinct?
- 11. Búsqueda semántica con NLP y elasticsearch
- 12. herramientas de programación NLP usando PHP?
- 13. NLP: oración cualitativamente "positiva" frente a "negativa"
- 14. Almacenamiento en caché en Node Express: ¿Cómo clasifica como lista blanca/lista negra?
- 15. ¿Qué clasifica Google como operación de escritura del almacén de datos en Google App Engine?
- 16. Distinto, cuenta y clasifica en una consulta sql
- 17. MapReduce - Cómo se clasifica la salida por valor
- 18. Algoritmo NLP para 'completar' los términos de búsqueda
- 19. ¿Qué bibliotecas ofrecen métodos NLP básicos o avanzados?
- 20. Stanford Core NLP: comprensión de la resolución de correferencia
- 21. Cómo extraer objetos del verbo sujeto usando nlp java
- 22. ¿Cómo se clasifica una ArrayList de HashMaps que contiene varios pares clave-valor cada uno?
- 23. Procesamiento de datos de texto con formato incorrecto con aprendizaje automático o NLP
- 24. ¿Cómo puedo usar NLP para analizar los ingredientes de la receta?
- 25. Interesante proyecto de estilo NLP/aprendizaje automático - análisis de las políticas de privacidad
- 26. Ordenar cadenas en MATLAB como Windows 7 clasifica los nombres de archivos en el explorador (respetando los numerales de la cuerda)
- 27. ¿Cómo usar NLP para separar un contenido de texto no estructurado en párrafos distintos?
- 28. Extraer de manera irregular la fecha de la cadena (fecha de análisis, NLP)
- 29. Qué herramientas NLP usar para unir frases que tengan un significado o semántica similar
- 30. Sincronización de texto y audio. ¿Hay una biblioteca NLP/speech-to-text para hacer esto?
Esto no es particularmente bueno para el humor, ya que un enfoque bayesiano asume independencia entre las diferentes palabras ("efectos"). En el humor esa es una suposición increíblemente débil, ya que son construcciones de alto nivel que hacen buen humor en lugar de ocurrencias de palabras individuales. –