18

Ahora, me doy cuenta de que la respuesta inicial a esto es "no se puede" o "usar análisis", pero continuaré con la esperanza de que alguien tenga más conocimiento que eso.Cómo decodificar google gclids

Adwords de Google con "autotagging" agrega un "gclid" (presumiblemente "ID de clic de google") al enlace que lo envía al sitio anunciado. Aparece en el registro web porque es un parámetro de consulta y Analytics lo utiliza para vincular esa visita al anuncio/campaña.

Lo que me gustaría hacer es extraer cualquier información útil del gclid para hacer nuestro propio análisis de nuestro tráfico. Las razones para esto son:

  • Las estadísticas son imperfectas, pero si las estamos recopilando, sabemos exactamente qué suposiciones hemos realizado y cómo se calcularon.
  • Podemos relacionar los datos con el resto de nuestros datos y generar estadísticas mucho más precisas con la tasa de conversión.
  • No tenemos que depender de JavaScript para las conversiones.

Ahora está claro que el gclid está codificado en base64 (o en alguna variante cercana) y algunas partes varían más que otras. Más allá de eso, no he podido determinar a qué se relaciona.

¿Alguien tiene alguna idea de cómo podría abordar la descodificación de esto, o alguien ya ha relacionado gclids de nuevo a sus comparaciones o incluso cuentas?

He hablado con un par de personas en google, ya pesar de su lema de "no seas malo", no estaban dispuestos a discutir la posibilidad de divulgar esta información, incluso bajo un NDA. Parece que les gusta el monopolio que tienen sobre nuestras estadísticas web.

+0

sin embargo, no parece un comentario relacionado, pero, por favor, permita. El lema de Google en Adword es "ser malvado". Google chupa el dinero de todos los propietarios de pequeñas y medianas empresas como un vampiro de sangre. – Mani

+0

Existe esta explicación: https://deedpolloffice.com/blog/articles/decoding-gclid-parameter – bastien

Respuesta

1

Bueno, esto no es una respuesta, pero el enfoque es similar a cómo abordaría cualquier problema de criptografía.

Posibilidad 1: Son aleatorios, en cuyo caso, estás jodido. Esto es análogo a un pad de una sola vez.

Posibilidad 2: "significan" algo. En ese caso, debes controlar el entorno.

  1. Consigue una buena base de datos de ellos. Encuentra gclids para tu sitio y otros. Registre todos los tiempos que ocurran todos los clics y cualquier otro dato potencialmente útil
  2. ¡Obtenga agrietamiento! Como ya ha comenzado, empiece a hacer una regresión de los datos recopilados con respecto a los conocidos y vea si puede encontrar patrones utilizados para descifrar las técnicas
  3. Comience a raspar gclid's aleatorios y vea a dónde lo llevan.

No me gustaría tener muchas esperanzas de que esto tenga éxito, ¡pero le deseo suerte!

+0

Re 1 - Estoy bastante convencido de que no son aleatorios. Nuestros gclids son similares, los de otras personas también son similares, pero diferentes al nuestro. Definitivamente no son un simple incremento de identificación. 2.1 - Este es * hard * ya que hay muchos gclids que no ves (si no hacen clic en ellos). ... – Draemon

+0

... He recogido una lista grande de los troncos, y han identificado qué bytes cambiar más que otros, y mi cerebro grita "esto no es al azar", pero más allá de eso no ha llevado a ninguna parte. 2.2/2.3 - Me encantaría un enlace a cualquier técnica o herramienta - el instinto no me ha llevado muy lejos. – Draemon

+0

tbh No tengo mucha esperanza tampoco, pero sería genial, y realmente no creo que esto sea algo sobre lo que Google deba tener el monopolio. Simplemente tengo la sensación de que es "fácil si sabes cómo" – Draemon

21

Con mucho, la solución más fácil es etiquetar manualmente sus enlaces con los parámetros de seguimiento de campañas de Google Analytics (utm_source, utm_campaign, utm_medium, etc.) y luego extraer esos datos.

gclid depende de algo más que de la cuenta/campaña de AdWords/etc. Si hace clic en el mismo anuncio de AdWords dos veces, podría darle diferentes gclids, porque también hay todo tipo de datos de sesión y costos asociados con ese clic en particular.

Gclid probablemente no sea 100% aleatorio, es cierto, pero me sorprendería mucho si le fuera posible extraer todos sus datos de Adwords de ese número. Eso sería un gran error de seguridad (es decir, un usuario arbitrario podría ver sus datos de Adwords). Lo más probable es que se genere un gclid pseudoaleatorio con cada impresión, y si se hace clic en ese anuncio, el gclid se registra en Adwords (de lo contrario, se descarta). Luego, Analytics usa ese número para reconciliar los datos con Adwords. Aparte de eso, no hay ningún valor intrínseco en el número de gclid en sí.

En lo que respecta a su último punto, intentar prohibir o aplicar ingeniería inversa a esta información está explícitamente prohibido tanto en Google Analytics como en las Condiciones del servicio de Google Adwords, y es motivo de una prohibición permanente. Además, los TOS que acordó cuando se suscribió a estos servicios dicen que no se trata de utilizar sus datos de la forma que le apetezca. Google brinda un servicio gratuito, por lo que existen condiciones. Si no le gusta no tener control total sobre sus datos, entonces hay muchas otras soluciones disponibles. Sin embargo, pagará una prima por ese tipo de control.

Google obtiene casi todo su dinero de la venta de anuncios. Adwords es su mayor producto para hacer dinero. No le van a dar información confidencial sobre cómo funciona. No saben quién es usted o qué va a hacer con esa información. No importa si usted firma una NDA y tienen un recurso legal para demandarlo; Si regala esa información a un competidor, su vida no vale lo suficiente como para devolver el dinero que habrá perdido.

Lamento decírtelo, pero "Do not be Evil" o no, Google es una empresa, no una organización benéfica. No se convirtieron en una de las compañías más exitosas del mundo regalando su algoritmo de búsqueda al primer tipo que lo solicitó.

8

FYI, acabo de publicar un análisis rápido de algunos datos de glcid de mis sitios en this post. Definitivamente hay algo de estructura en el gclid, pero es difícil de descifrar.

+0

Gracias por la información - ¡es bueno saber que alguien más tiene curiosidad! Realmente necesita decodificar los caracteres antes de buscar patrones, ya que base64 extenderá los bytes fuente sobre los bytes codificados adyacentes. He hecho un análisis similar a mí mismo y, de manera similar, me he convencido de que hay algún tipo de patrón, pero no tengo idea de qué. – Draemon

+0

El análisis de caracteres es muy interesante, y esencialmente demuestra que hay datos codificados en estos gclids ... muy bien. – ojrac

0

Un enfoque diferente es simplemente mirar los datos de referencia que proporcionarán al menos la palabra clave que se buscó.

+0

los datos de referencia son enviados por el cliente (agente de usuario) y no son confiables. – Draemon

0

Estoy de acuerdo con Ophir y Chris. Mi sensación es que se trata simplemente de un número de serie/identificador de clic único, que solo abre sus secretos cuando los sistemas Analytics y Adwords se comunican entre sí detrás de las escenas.

Sabiendo esto, recomendaría mirar la URL de referencia y sacar tanto como sea posible de esto para usar en la configuración de seguimiento de clics en la parte de atrás.

Por ejemplo, vivo en Nueva Zelanda y estoy usando Firefox. Esta es una búsqueda desde la barra de herramientas de Firefox Google de "desbordamiento de pila": http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en-GB

Se puede ver que: a) el uso de im dominio .NZ, b) las palabras clave "pila + desbordamiento", c) im ejecutando Firefox.

Por último, si también oculta la URL completa de la página de destino, puede almacenar el GCLID, que le indicará que el visitante proviene de pago, mientras que si no tiene un GCLID, entonces el usuario debe haber provenido de búsqueda (si el etiquetado de URL está habilitado por supuesto).

Esto teóricamente te permitiría buscar la palabra clave en tu campaña y averiguar de qué grupo de anuncios provienen. Sin embargo, conocer la creatividad probablemente sería imposible, a menos que se dividan las URL de aterrizaje o se etiqueten de alguna manera.

+0

estuvo de acuerdo en que si el gclid era una referencia genuinamente opaca, ese es el final. Sin embargo, estoy bastante convencido de que tiene cierta estructura. La poca información que tenía de Google parecía implicar esto. – Draemon

4

He estado trabajando en este problema en nuestra empresa también.Nos gustaría poder tener una mejor idea de lo que está haciendo AdWords, pero estamos frustrados con las limitaciones en Analytics.

Nuestra solución actual es buscar en los registros de acceso de Apache para peticiones GET usando la expresión regular:

.*[?&]gclid=([^$&]*) 

Si lo que existe, a continuación, nos fijamos en la cadena árbitro para obtener la palabra clave:

.*[?&]q=([^$&]*).* 

Una opción alternativa es cambiar el registro web de Apache para iniciar el registro de la cookie __utmz que establece google, que debe tener una pieza para la palabra clave en utmctr. Google __utmz cookie y usted debería poder encontrar mucha información.

¿Qué tan precisa es la cadena de referencia? No es 100% Los cortafuegos y los dispositivos de seguridad lo eliminarán. Pero analizarlo usted mismo le da más flexibilidad que Google Analytics. Sería una gran característica enviar el gclid a AdWords y recuperar datos, pero esa característica no parece estar disponible.

EDITAR: Desde que escribí esto, también hemos creado nuestras propias etiquetas que se añaden a cada url de destino como un parámetro de solicitud. Cada etiqueta es solo un hash md5 del texto, grupo de anuncios y nombre de la campaña. Lo tomamos usando expresiones regulares del registro de acceso y lo buscamos en una base de datos SQL.

+0

esto fue útil para mí, gracias :) – LeonardChallis

+0

@Jeff Wu He leído su respuesta y, específicamente su edición. Me pregunto cómo adjuntó sus propios parámetros de solicitud a las URL de destino: ya tenemos muchas campañas en marcha, por lo que sería muy laborioso. Para el beneficio de otros que podrían preguntarse lo mismo, las secuencias de comandos de Google AdWords son una forma de hacerlo. Aquí hay un par de enlaces útiles: [Documentación de Google] (https://developers.google.com/adwords/scripts/) y [Script de ejemplo que agrega parámetros a las URL] (http://www.freeadwordsscripts.com/ 2012/12/auto-add-valuetrack-params-to-all.html) – mozz100

+0

Eso es genial, no estaba al tanto de esa biblioteca Javascript cuando implementamos esto. Escribí un script de Python para tomar un CSV de anuncios y agregar la etiqueta a cada uno de los enlaces. Nuestro gerente de campaña tomaría el CSV y lo cargaría a AdWords utilizando la utilidad de escritorio. –

0

Aquí hay un pensamiento: ¿existe la posibilidad de que el gclid sea simplemente un hash criptográfico, un bit.ly u otro acortador de URL?

En cuyo caso, los contenidos del texto hash se escribirían en una base de datos y se reemplazarían con una identificación única.

Después de todo, el gclid está acortando un montón de texto largo.

Toma este ejemplo: www.example.com?utm_source=google & utm_medium = cpc

se convierte en esto: www.example.com?gclid=XDF

al igual que un acortador de URL .

Uno necesitaría un cifrado de sustitución con el fin de realizar ingeniería inversa del código criptográfico ... no es tan fácil tarea: https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

Tal vez algunos profunda excavación en los registros, en busca de patrones, etc ...

+0

No, el gclid definitivamente no es un hash criptográfico, ya que tiene una entropía terrible (los gclids de la misma cuenta serán bastante similares). . Algo está codificado en estos gclids, pero descubrir qué o cómo es otra cosa en total. – Draemon

0

Parece que mi representante es débil, así que solo publicaré otra respuesta en lugar de un comentario.

Esto no es una respuesta, claramente. Solo expresando algunos pensamientos.

Cuando habilita el etiquetado automático en Adwords, los parametros gclid no se agregan a las URL de destino. En cambio, los servidores de seguimiento de clic de Google los anexan a las URL de destino en tiempo de ejecución. Así que, una de dos cosas está sucediendo:

  1. El clic servidores están almacenando el gclid junto con identificadores de entidad de Adwords de manera que más tarde Analytics puede mirar hacia arriba.

  2. gclid tiene los identificadores de entidad codificados de alguna manera para que Analytics pueda decodificarlos.

Desde la perspectiva del rendimiento parece poco probable que Google pondría en práctica algo como opción 1. Forzar Analytics para "unirse" a la gclid a Adwords identificadores parece excepcionalmente ineficaz a escala.

14

El parámetro gclid está codificado en Protocol Buffers, y luego en una variante de Base64.

Consulte este guide to decoding the gclid e inténtelo, incluida una función de PHP (con licencia de Apache) que puede usar.

Básicamente hay 3 parámetros codificados en su interior, uno de los cuales es una marca de tiempo. Los otros 2 aún no se conocen.

En cuanto a la comprensión de lo que significan estos otros parámetros, puede ser útil compararlo con el parámetro ei, que es encoded in an extremely similar way (básicamente Protocol Buffers con las claves eliminadas). El parámetro ei también tiene una marca de tiempo, con lo que parecen ser microsegundos y otros 2 enteros.

+0

+1. 5 años después y alguien piensa probar protobuf. ¡Con suerte, alguien descubrirá cómo relacionar esto con Adwords en algún momento! – Draemon

+0

@Draemon no respondí la pregunta, ¿podría aceptarlo? – andre

4

creo que se puede conseguir todas las ventajas vinculadas a la gclid través de la API de Google Adwords. Específicamente, puede consultar el informe de rendimiento de clics.

https://developers.google.com/adwords/api/docs/appendix/reports#click

+0

Sí, esta es una nueva opción que proporciona Google. Sin embargo, no puede obtener datos históricos muy antiguos de este punto final API, por lo que es bueno para datos más nuevos. – Bani

0

Esta es una forma no-programática para descodificar el parámetro GCLID. Lo más probable es que simplemente intente descubrir la campaña, el grupo de anuncios, la palabra clave, la ubicación y el anuncio que generaron el clic y la conversión. Para ello, puede cargar el GCLID en AdWords como un tipo de conversión por separado y luego segmentar por tipo de conversión para acceder a los criterios que activaron la conversión. Estos pasos:

  1. En AdWords interfaz de usuario, vaya a Herramientas> Conversions-> Añadir conversión con la fuente "Importar de" clics
  2. Visita la ayuda de AdWords tema acerca de cómo importar conversiones https://support.google.com/adwords/answer/7014069 y crear un archivo de carga masiva con su los valores GCLID, la asignación de las conversiones a que nuevo tipo de conversión "Importar de clics"
  3. Subir las conversiones en AdWords en Herramientas-> Conversions-> acciones de conversión (Cargas) de navegación de la izquierda
  4. Ir a la pestaña de campañas, segmentos-> Conversiones-> Nombre de conversión
  5. Fi Encuentra tu nuevo nombre de conversión en la lista de segmentos, aquí es donde proviene la conversión. Continúe este mismo proceso en la pestaña de grupos de anuncios y palabras clave hasta que conozca los criterios de origen de GCLID