Le pedí un question similar a este hace un par de semanas, pero no hice la pregunta correctamente. Así que vuelvo a hacer aquí la pregunta con más detalles y me gustaría obtener una respuesta más orientada a IA.Algoritmo para clasificar una lista de productos? Tome 2
Tengo una lista que representa productos que son más o menos lo mismo. Por ejemplo, en la lista a continuación, todos son discos duros Seagate.
- disco duro Seagate 500Go
- disco duro Seagate 120Go para el ordenador portátil
- Seagate Barracuda 7200.12 ST3500418AS 500 GB 7200 RPM SATA 3,0 Gb/s de disco duro
- nuevo y brillante disco duro de Seagate 500Go
- Seagate Barracuda 7200.12
- Seagate FreeAgent Desk Disco duro externo de 500GB Plata 7200RPM USB2.0 Minorista
- GE Spacemaker Laudry
- Mazda3 2010
- Mazda3 2009 2.3L
Para un ser humano, los discos duros de 3 y 5 son los mismos. Podríamos ir un poco más lejos y suponer que los productos 1, 3, 4 y 5 son los mismos y poner en otras categorías el producto 2 y 6.
En mi pregunta anterior, alguien me sugirió usar la extracción de características . Funciona muy bien cuando tenemos un pequeño conjunto de datos de descripciones predefinidas (todos los discos duros), pero ¿qué pasa con el otro tipo de descripción? No quiero comenzar a escribir extractores de funciones basados en expresiones regulares para todas las descripciones que mi aplicación podría enfrentar, no escala. ¿Hay algún algoritmo de aprendizaje automático que pueda ayudarme a lograr esto? El rango de descripción que puedo obtener es muy amplio, en la línea 1, podría ser una nevera, y luego en la siguiente línea, un disco duro. ¿Debería intentar tomar la ruta de la Red Neural? ¿Cuáles deberían ser mis entradas?
¡Gracias por la ayuda!
Interesante pregunta. Voy a enfrentar algún simillar en los próximos meses. – JoshBerke