2011-11-19 26 views
5

Me gustaría realizar un procesamiento del lenguaje natural en recetas de cocina, en particular los ingredientes (tal vez preparación más adelante). Básicamente, estoy buscando crear mi propio conjunto de etiquetas POS para ayudarme a determinar el significado de una línea de ingredientes.Etiquetado manual de un conjunto de entrenamiento con etiquetas personalizadas

Por ejemplo, si uno de los ingredientes fue: 3/4 taza (ligeramente embalado) hojas de hoja plana de perejil, divididos

me gustaría etiquetas para expresar el ingrediente ser enumerado y la quanitity, que es generalmente un número seguido de alguna unidad de medida. Por ejemplo:

3 \ NUM-QTY/\ FRACTION4 \ NUM-QTY cup \ N-MEAS (ligeramente \ ADV packed \ VD) [hoja plana \ ADJ perejil \ N] \ INGREDIENT leaves \ N, divide \ VD

Las etiquetas que encontré here.

estoy seguro acerca de algunas cosas:

  1. debo utilizar etiquetas personalizadas, o debería estar haciendo algún tipo de procesamiento post-tagging después de usar un etiquetador preexistente?
  2. Si utilizo etiquetas personalizadas, ¿es la mejor manera de hacer un texto de capacitación para ir a través de una lista de ingredientes y etiquetar todo a mano?

Siento que este procesamiento del lenguaje es tan específico que sería beneficioso entrenar a un etiquetador en un conjunto aplicable, pero no estoy muy seguro de cómo proceder.

Gracias!

Respuesta

3

Utilice la biblioteca pattern.search.

La biblioteca de patrones de python admite muchas etiquetas [1], incluida una etiqueta de número cardinal (CD).

Una vez que haya etiquetado a los cardenales, las fracciones son "cardinales/cardinales" o algo así como "cardenal cardenal/cardenal".

Y con respecto a las cantidades, debe compilar una taxonomía de cantidades de cocción. la biblioteca de patrones de python también admite la lematización [2].

Creo que al utilizar pattern.search [2] podría crear una Restricción que se ajuste a sus datos, y realizar búsquedas de patrones en texto usándola.

[1] http://www.clips.ua.ac.be/pages/mbsp-tags [2] http://www.clips.ua.ac.be/pages/pattern-search

+0

Cosas increíbles, gracias. Ya tengo la taxonomía escrita, así que solo necesito conectarla a pattern.search. – abroekhof

Cuestiones relacionadas