Estoy considerando una Prueba de concepto para manejar grandes volúmenes de datos como> 10 G que requieren al menos más de 200 escrituras por segundo y más de 50 lecturas por segundo de datos espaciales relacionados. Este es un sistema en crecimiento también. Actualmente estoy considerando mover estos datos de gran volumen a un tipo de tabla grande de NoSql por razones de rendimiento.Datos espaciales con mongodb o cassandra
He considerado y he echado un vistazo más de cerca a MongoDB y cassandra. En cuanto a mi lectura va,
MongoDB: - parece tener un problema de bloqueo de escritor - uno de los puestos en stackoverflow sugerido esta dB si no hay necesidad de múltiples servidores - índices mantienen en la memoria. Por lo tanto, cuanto mayor sea el crecimiento del índice, el rendimiento se deteriorará - la ventaja es que Mongodb tiene soporte directo para la indexación de datos espaciales & junto con características como encontrar ubicaciones cercanas, etc. - Veo este post Cassandra Or MongoDB For Our Location Based Application sugiriendo mongodb como la mejor opción
Cassandra:
- parece ser el mejor de entre los dbs relacionados - parece tener un gran escritura, así como el rendimiento de lectura - no forma nativa soporte de indexación espacial, pero esto puede extenderse a través de geohashing
Mi corazón realmente sale para mongodb debido a eso s buena documentación y soporte directo para datos espaciales. ¿Algún cuerpo ha tenido una mala experiencia al usar mongodb para sistemas tan grandes? De hecho, veo muchos mensajes en mongodb iostat para el rendimiento.
Si mongodb no es adecuado, ¿alguien puede dar algunos consejos sobre geohashing usando cassandra? Vi el enlace http://code.google.com/p/geospatialweb/ para crear los valores hash. Pero hay preguntas sobre cómo consultar, etc.
Alguna idea sobre NoSQL almacenamiento spartial, 1+ años más tarde? –
De hecho, no usamos Simplegeo debido a algunas razones, pero se mantuvo cassandra. Finalmente elegimos mantenerlo simple con latitud y longitud como valores separados y elegimos tener las teclas correctas. Estamos teniendo bastante éxito al distribuir esto con 8 servidores y obtener resultados en menos de un segundo tipo de rendimiento para consultas diarias y estamos contentos. – Muthu
Excelente información, gracias Muthu. –