2009-02-14 10 views

Respuesta

6

Hay una investigación sobre esto, se llama Computational Humor. Es un área interdisciplinaria que toma elementos de la lingüística computacional, la psicolingüística, la inteligencia artificial, el aprendizaje automático, etc. Intentan descubrir qué es lo que hace que las historias o bromas sean divertidas (por ejemplo, la conexión inesperada o el uso de un tema tabú de una manera sorprendente etc.) y aplicarlo al texto (ya sea para generar una historia divertida o para medir el "sentido del humor" del texto).

Hay books y artículos sobre esto (por ejemplo, Graeme Ritchie).

0

La única manera de lograrlo es conseguir que un par de miles de personas (los monos no lo hagan, lo siento) que miren miles de oraciones/historias divertidas, las califiquen y luego construyan algún tipo de sistema experto/red neuronal fuera de él. Dado el alcance del problema y la subjetividad (una cosa graciosa para una persona puede no ser divertida, incluso ofensiva para otra), diría que es una tarea imposible.

5

Sí, debe usar un Cuerpo de entrenamiento para construir un modelo predictivo capaz de detectar oraciones divertidas. A veces esto se conoce como "Análisis de sentimiento" en la literatura. Eche un vistazo a este artículo sobre Sentiment Analysis with LingPipe.

Si puede usar Java, puede usar su biblioteca (consulte license matrix). Lo encontré muy útil, no exactamente en el mismo contexto que tú.

0

Puede utilizar la misma técnica que los filtros de correo no deseado. En lugar de spam/no spam clasificas en divertido/no divertido. Mire en los clasificadores bayesianos ingenuos para más información.

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

+1

Esto no es particularmente bueno para el humor, ya que un enfoque bayesiano asume independencia entre las diferentes palabras ("efectos"). En el humor esa es una suposición increíblemente débil, ya que son construcciones de alto nivel que hacen buen humor en lugar de ocurrencias de palabras individuales. –

Cuestiones relacionadas