Conoce la funcionalidad en Excel cuando escribe 3 filas con un patrón determinado y arrastra la columna hasta el final Excel intenta continuar el patrón por usted.¿Cómo detectar y analizar patrones similares como Excel?
Por ejemplo
Tipo ...
- prueba-1
- prueba-2
- prueba-3
Excel continuará con:
- prueba-4
- prueba-5
- prueba-n ...
mismas obras de algunos otros patrones como las fechas y así sucesivamente.
estoy tratando de lograr algo similar pero también quiero para manejar los casos más excepcionales, tales como:
- prueba-azul-somethingelse
- prueba-amarillo-somethingelse
- prueba-roja -somethingelse
Ahora basado en esta entradas que quiero decir que el patrón es:
- los Ensayos [DINÁMICO] -algo
continuar la [DINÁMICO] con otros colores es toda otra cosa, realmente no me importa eso ahora. Estoy más que interesado en detectar las partes [DYNAMIC] en el patrón.
Necesito detectar esto de una gran cantidad de entradas de la piscina. Supongamos que tiene 10.000 cadenas con este tipo de patrones, y desea agrupar estas cadenas en función de la similitud y también detectar qué parte del texto cambia constantemente ([DINÁMICO]).
La clasificación de documentos puede ser útil en este escenario, pero no estoy seguro de por dónde empezar.
ACTUALIZACIÓN:
me olvidó mencionar que también es posible tener varios patrones [Dinámico].
Tales como:
- test_ [DINÁMICO] [DYNAMIC2]
no creo que es importante, pero tengo la intención de implementar esto en.NET, pero cualquier sugerencia sobre los algoritmos a usar sería bastante útil.
por 10.000 patrones diferentes? ¿Cómo se puede decir cuál se parece a cuál? también no se sabe dónde está la dinámica, tal vez el comienzo, tal vez el final, tal vez en el medio tal vez no exista en absoluto. –
excel tampoco lo hace para 10k patrones diferentes tampoco. toma una muestra muy pequeña (= lo que seleccionó) y calcula la parte dinámica de eso (o no: P). una vez que tenga su parte dinámica puede comenzar a compararla con patrones conocidos (es decir, ambos son enteros y aumentan, ambos son enteros y decrecientes). – Niko
Sé que Excel utiliza un número limitado de muestras, pero como dije en la pregunta, lamentablemente eso no funciona para mí. Necesito hacer esto, digamos 1000 cadenas, pero potencialmente más. Gracias por el psuedocode puede ser bastante útil en mis pruebas. –