¿Cómo encontrar si un punto está dentro de un conjunto de intervalos?

Busco la manera más rápida para decidir si es o no un punto en una línea se encuentra dentro de un subconjunto de esta línea. me dan un Punto de número entero, y también tengo una "lista" de cualquiera de:¿Cómo encontrar si un punto está dentro de un conjunto de intervalos?

Puntos, representado por un número entero (3, 10, 1000, etc)
Intervalos, que represento por 2 enteros (2:10 son todos enteros de 2 a 10 inluidos, 50:60, etc.)

En este ejemplo, si el valor de mi punto es 5, entonces devuelvo verdadero porque está incluido en un intervalo , lo mismo para 55. Si mi punto es igual a 1000, también devuelvo verdadero porque coincide con la lista de puntos.

Estoy buscando una forma rápida (más rápida que lineal) para verificar esta condición, SIN tener que exponer tantos enteros como posibles puntos (es decir, para un intervalo 1: 1000 no quiero instanciar 1000 enteros). ¿Se puede hacer esto en un tiempo logarítmico?

Gracias

edición: se puede considerar que cualquier tiempo necesario para pre-procesar la lista de datos es igual a 0, porque una vez que mis intervalos iniciales se procesan Necesito aplicar esta prueba a 10k puntos

Fuente

2012-04-12 lezebulon

¿pueden superponerse los intervalos? No estoy seguro si eso importa, pero parece que debería. – Almo

podrían, pero puedo preprocesar mis datos para que ya no funcionen, lo cual no es un problema en cuanto al tiempo porque estoy usando los mismos conjuntos de intervalos para procesar 10k puntos – lezebulon

¿Se ordenaron? – Freddy

Hm, tal vez usted puede utilizar un intervalo o un árbol segmento:

Fuente

2012-04-12 19:57:40

+1 para la respuesta correcta. Este es un problema de geometría computacional bien estudiado ("consulta de apuñalamiento 1D"). – Nemo

Primero verifique un hash_map de puntos. Esa es la simple verificación.

Después, simplemente pedir un mapa de intervalos por la primera coordenada y luego encontrar de límite distinto del punto.

A continuación, compruebe si está contenida en el elemento devuelto. Si no estás en eso, no estás en ninguno.

Fuente

2012-04-12 19:53:14 ex0du5

Parece haber suposiciones en algunas de las respuestas que los intervalos pueden superponerse. Usted tiene el control de la estructura de datos que utiliza para resolver este problema: no necesita ninguna dependencia externa o el intervalo inicial establecido. Por lo tanto, no debe almacenar intervalos superpuestos en general: únase a ellos cuando los inserte en el mapa. Cuando se trata de intervalos, esto es bastante estándar. – ex0du5

Si tiene los rangos enteros ordenados y los rangos no coinciden, puede realizar una búsqueda binaria para encontrar el rango correcto en tiempo logarítmico.

¿Hay alguna restricción en el rango? En función de eso, probablemente puedas utilizar la función hashing para buscar en tiempo constante. Pero esto depende de cómo sean tus limitaciones.

Fuente

2012-04-12 19:54:48 cgcoder

Creo que puedo suponer que el rango está entre 0 y 10 millones. – lezebulon

Si algunos rangos se superponen, puede ordenarlos y colapsar los que se superponen en un solo rango. –

Podría hacer eso en tiempo sublineal DANDO una estructura de árbol de datos (recomendaría un B-tree), si no cuenta el tiempo necesario para construir el árbol (la mayoría de los árboles tardan n log o tiempo similar para construir).

Si solo tiene una lista simple, entonces no puede hacerlo mejor que lineal, porque en el peor de los casos tiene que verificar todos los puntos e intervalos.

Fuente

2012-04-12 19:55:37 user1258361

Se puede utilizar un Bloom Filter para probar un punto y ver si es no en un intervalo, en O (1) tiempo lineal. Si supera esa prueba, debe usar otro método, como una búsqueda binaria, para ver si es definitivamente parte de un intervalo, en el tiempo O (log n).

Fuente

2012-04-12 20:06:42

¿La idea es hash cada punto en el intervalo? – mavam

@MatthiasVallentin, sí lo es. El tamaño del Filtro Bloom depende del número de puntos establecidos y la probabilidad de falsos positivos, no del posible rango de entradas. –

Gracias, entiendo tu idea ahora. Sin embargo, hay muchas opciones que modificar los parámetros del filtro para corregir inicialmente. Dado que esta estructura de datos se utiliza a menudo en entornos con limitaciones de espacio, un enfoque común es asumir un tamaño fijo y establecer la cardinalidad para derivar el valor óptimo de * k *, el número de funciones hash. ¿Podría aclarar qué quiere decir con "tamaño"? Una vez instanciado, el tamaño del filtro Bloom (básico) ya no cambia. – mavam

Después de la reflexión, creo que el siguiente código debe trabajar en tiempo logarítmico, excluyendo el tiempo necesario para construir el mapa:

enum pointType { 
    point, 
    open, 
    close 
}; 
std::map<long int, pointType> mapPoints; 

mapPoints.insert(std::pair<long int, pointType>(3, point)); 

//create the 5:10 interval: 
mapPoints.insert(std::pair<long int, pointType>(5, open)); 
mapPoints.insert(std::pair<long int, pointType>(10, close)); 

int number = 4; 
bool inside = false; 
std::map<long int, pointType>::iterator it1 = mapPoints.lower_bound(number); 

if(it1->first == number || it1->second == close) { 
    inside = true; 
}

Creo que esto debería funcionar, siempre y cuando el mapa se llena correctamente con no -sin intervalos de solapamiento

Fuente

2012-04-12 21:18:16 lezebulon

¿Cómo encontrar si un punto está dentro de un conjunto de intervalos?

Respuesta

Cuestiones relacionadas