¿Alguien sabe cómo se organizan los datos en Google Analytics? Difícil selección de grandes cantidades de datos que realizan muy, muy rápido, ¿qué estructura de base de datos es?Base de datos de Google Analytics
Respuesta
Muchos lugares y aplicaciones en la cartera de Google utilizan el algoritmo MapReduce para el almacenamiento y procesamiento de grandes cantidades de datos.
Ver el Google Research Publications on MapReduce para más información y también echar un vistazo a page 4 y page 5 de this artículo de línea de base.
Me asumir que usan su 'Big Table'
yo sepa Google Analytics se deriva de Urchin. Como se ha dicho, es posible que, desde ahora, Analytics sea parte de la familia de Google y esté utilizando MapReduce/BigTable. Puedo suponer que Google había integrado el antiguo formato de Urchin DB con el nuevo BigTable/MapReduce.
Encontré este enlace que habla sobre Urchin DB. Probablemente algunas de las cosas todavía están en uso en este momento.
http://www.advanced-web-metrics.com/blog/2007/10/16/what-is-urchin/
esto dice:
[snip] ... todavía utilizar una base de datos propia para almacenar los datos de informes, lo que hace ad hoc consulta un poco más limitado, ya que se debe utilizar Herramientas desarrolladas por Urchin en lugar de las herramientas SQL más flexibles.
http://www.urchinexperts.com/software/faq/#ques45
¿Qué tipo de base de datos no utilizar Urchin?
Urchin utiliza una base de datos de archivos planos patentada para el almacenamiento de datos de informe. La arquitectura de base de datos de alto rendimiento maneja sitios de mucho tráfico de manera eficiente. Algunas de las ventajas de la arquitectura de base de datos incluyen:
* Small database footprint approximately 5-10% of raw logfile size
* Small number of database files required per profile (9 per month of historical reporting)
* Support for parallel processing of load-balanced webserver logs for increased performance
* Databases are standard files that are easy to back up and restore using native operating system utilitiesv
Más información sobre Urchin
http://www.google.com/support/urchin45/bin/answer.py?answer=28737
hacemucho tiempo yo solía tener un rastreador y en su sitio que estaban discutiendo sobre la normalización de datos : http://www.2enetworx.com/dev/articles/statisticus5.asp
Allí puede encontrar un poco de información sobre cómo reducir los datos en DB y quizás sea un buen comienzo en la investigación.
Google publicación: Chang, Fay, et al. "Bigtable: A distributed storage system for structured data." ACM Transactions on Computer Systems (COT) 26,2 (2008):
Bigtable es utilizado por más de sesenta productos y proyectos de Google, incluyendo Google Analytics, Google Finance, Orkut, personalizado búsqueda, Writely, y Google Earth.
- 1. Datos de Google Analytics
- 2. ¿Cómo Google Analytics envía datos a Google?
- 3. Google Analytics: ¿puede recopilar datos del formulario?
- 4. ¿Qué datos se envían a Google Analytics?
- 5. ¿Alguien sabe cómo google Analytics procesa datos?
- 6. Google Analytics android dispatch
- 7. Incrustable Google Analytics "Flair"?
- 8. Obtén datos de Google Analytics con el token de Oauth?
- 9. Google Analytics y Python
- 10. ¿Cómo funciona Google Analytics In-Page Analytics?
- 11. R - Paquete de Google Analytics
- 12. ¿Puede Google Analytics Pro proporcionar datos específicos de video?
- 13. API de Google Analytics: Obtener datos específicos utilizando php
- 14. ¿Cómo rastrean los datos demográficos de Alexa y Google Analytics?
- 15. ¿Con qué frecuencia google analytics actualiza los datos de tráfico?
- 16. ¿Cómo obtener datos de Google Analytics usando OAuth?
- 17. Google Analytics Site Search
- 18. Barniz y Google Analytics
- 19. Google Analytics - Seguimiento desconocido
- 20. Google Analytics: Js externos
- 21. Google Analytics API error 403: "El usuario no tiene ninguna cuenta de Google Analytics"
- 22. Google Analytics API y .Net
- 23. google analytics seguimiento del servidor
- 24. iFrames + Google Analytics + Cookies + P3P
- 25. Google Analytics - Bloques HTML/página de representación
- 26. Implementación de Google Analytics con Django
- 27. Google Analytics con múltiples subdominios
- 28. Uso de Google Analytics desde el servidor
- 29. JavaScript se ejecuta después de google analytics
- 30. Prueba de Google Analytics iOS SDK
Supongo que la mayoría de los desarrolladores que trabajan para Google han chamuscado algún tipo de acuerdo de confidencialidad y no pueden hablar de ello. – Kolky
Las respuestas a continuación son informativas, pero aún me pregunto cómo organizan esa información. ¿Están utilizando mapas/reducciones en tiempo real, o todos los puntajes ya están precalculados? Si esto último, nuevamente, ¿cómo organizan eso, porque la API permite filtros complejos y agrupa hasta 7 dimensiones? –