Me gustaría realizar un procesamiento del lenguaje natural en recetas de cocina, en particular los ingredientes (tal vez preparación más adelante). Básicamente, estoy buscando crear mi propio conjunto de etiquetas POS para ayudarme a determinar el significado de una línea de ingredientes.Etiquetado manual de un conjunto de entrenamiento con etiquetas personalizadas
Por ejemplo, si uno de los ingredientes fue: 3/4 taza (ligeramente embalado) hojas de hoja plana de perejil, divididos
me gustaría etiquetas para expresar el ingrediente ser enumerado y la quanitity, que es generalmente un número seguido de alguna unidad de medida. Por ejemplo:
3 \ NUM-QTY/\ FRACTION4 \ NUM-QTY cup \ N-MEAS (ligeramente \ ADV packed \ VD) [hoja plana \ ADJ perejil \ N] \ INGREDIENT leaves \ N, divide \ VD
Las etiquetas que encontré here.
estoy seguro acerca de algunas cosas:
- debo utilizar etiquetas personalizadas, o debería estar haciendo algún tipo de procesamiento post-tagging después de usar un etiquetador preexistente?
- Si utilizo etiquetas personalizadas, ¿es la mejor manera de hacer un texto de capacitación para ir a través de una lista de ingredientes y etiquetar todo a mano?
Siento que este procesamiento del lenguaje es tan específico que sería beneficioso entrenar a un etiquetador en un conjunto aplicable, pero no estoy muy seguro de cómo proceder.
Gracias!
Cosas increíbles, gracias. Ya tengo la taxonomía escrita, así que solo necesito conectarla a pattern.search. – abroekhof