2010-08-24 21 views

Respuesta

5

Alexa definitivamente obtiene la información del tráfico de los usuarios de la barra de herramientas. Como se trata de un grupo de personas relativamente pequeño y auto-seleccionador, esto inevitablemente conduce a una muestra sesgada (razón por la cual el tráfico de Alexa no coincide con el tráfico medido en los sitios que ejecuto). Incluso con las mejores técnicas estadísticas para reducir el sesgo, nunca puede deshacerse de él por completo cuando la distribución de muestreo no es uniforme.

No está claro cómo Google lo hace, aunque podría implicar el seguimiento de cookies.

Un proyecto en el que he estado trabajando recientemente tiene relación con esta pregunta.

Otra forma de hacer esto (que también tiene sesgos, pero diferentes) sería usar un IP al servicio de localización para encontrar la latitud y longitud aproximada de cada visitante a su sitio. A continuación, utilice mi proyecto (información completa: corro ese sitio y es comercial):

http://askgeo.com

para obtener información demográfica para esa ubicación. AskGeo en realidad proporciona información demográfica en varios niveles geográficos (estado, condado, subdivisión del condado, ciudad, código postal, sección censal (unas pocas miles de personas) y grupo de bloques censales (alrededor de mil personas). Es de suponer que desea utilizar el nivel más bajo (es decir, grupo de bloques del censo) para una latitud y longitud determinada

El sitio devuelve un gran número de variables demográficas. La idea sería utilizar conteos suaves de las variables demográficas proporcionadas en el nivel del grupo de bloques. tome un ejemplo, si está tratando de rastrear la distribución por edades de sus usuarios, entonces usaría los rangos de edad provistos en la respuesta AskGeo y para una muestra dada, agregaría un conteo suave fraccional a cada rango que corresponda a el porcentaje de la población en ese grupo de bloques del rango de edad correspondiente. Por ejemplo, tome mi vecindario en San Francisco. debido distribución por edades:

  • CensusAgePercent0To4: 7,3%
  • CensusAgePercent5To9: 3,5%
  • CensusAgePercent10To: 3,2%

... (se pierden un poco, ya que es probable que entiende la idea). ..

  • CensusAgePercentOver85: 1,5%

Si obtuvo una dirección IP que rastreó a ese grupo de bloques censales, agregaría cada uno de esos porcentajes (como una fracción de 0 a 1) a sus contadores (flexibles) para esos rangos de edad. (Un contador blando es solo un contador que permite recuentos no enteros.)

Se podría hacer lo mismo con la raza, sexo, nivel de ingresos, valor de la vivienda, etc.

Este método también tiene sesgos, con seguridad, ya que se supone que todas las personas en un grupo determinado bloque son igualmente es probable que visite su sitio. Pero es algo que puede hacer en su propio sitio, no solo Google y Alexa, y aún le daría una idea relativa de quién visita su sitio si sus cuentas blandas en una categoría determinada son más altas que el promedio nacional en ese categoría.

También es posible que una técnica más sofisticada que conteos directos simples podría conducir a un resultado mucho más rico.

0

hice algunas investigaciones, y al parecer estos datos demográficos se realiza un seguimiento de las mismas demografía de la audiencia de televisión manera se realiza un seguimiento. Hay personas que navegan con sus barras de herramientas (Alexa), que realiza un seguimiento de los sitios visitados. Estas personas voluntariamente (?) Proporcionan información como edad, sexo, etc. y Alexa extrapola los datos demográficos generales de esta muestra. Esto, por supuesto, deja espacio para el sesgo, pero ese es un problema con las estadísticas.

0

Alexa obtiene su información de las barras de herramientas del navegador que instala a propósito o como parte de un paquete con algún software. Hace preguntas para comprender los parámetros demográficos y también rastrea los sitios que visita. Si sabe que el 80% de los visitantes del sitio son mujeres y tiene un nuevo visitante que visita este sitio, puede pensar que hay una gran probabilidad de que esta persona sea una mujer. Si conoces muchos sitios que visita esta persona, puedes adivinar mucho.

Pero como http://netberry.co.uk/alexa-rank-explained.htm dice que puede confiar únicamente en la información de Alexa TOP100,000 porque entonces Alexa tiene suficiente información de una pequeña cantidad de usuarios que visitan estos sitios. Dicen "millones" pero es una pequeña porción del total