¿Hay alguna manera de evitar que Googlebot indexe ciertas partes de una página?

¿Es posible ajustar las directivas a Google a tal punto que ignorará parte de una página y aún así indexará el resto?¿Hay alguna manera de evitar que Googlebot indexe ciertas partes de una página?

Hay un par de cuestiones diferentes que hemos encontrado que ser ayudado por esta, tales como:

RSS feed texto/noticias de tipo ticker en una página de visualización del contenido de una fuente externa
usuarios que entran en detalles de teléfono de contacto, etc. que quieren hacerlos visibles en el sitio, pero prefieren no ser capaces google-

soy consciente de que las dos anteriores se pueden abordar a través de otras técnicas (como la escritura el contenido con JavaScript), pero me pregunto si alguien sabe si hay una opción más limpia disponible de Google?

He estado investigando sobre esto y he encontrado menciones de googleon and googleoff tags, pero estas parecen ser exclusivas de Google Search Appliances.

¿Alguien sabe si hay un conjunto similar de etiquetas a las que se adherirá Googlebot?

Editar: Solo para aclarar, no quiero pasar por la peligrosa ruta de encubrir/servir contenido diferente a Google, por lo que estoy buscando ver si hay una forma "legítima" de logrando lo que me gustaría hacer aquí.

Fuente

2009-09-30 ConroyP

Lo que estás pidiendo, realmente no se puede hacer, Google toma toda la página, o nada de eso.

Podrías hacer algunos trucos furtivos como insertar la parte de la página que no quieres indexada en un iFrame y usar robots.txt para pedirle a Google que no indexe ese iFrame.

Fuente

2009-09-30 11:17:25 RusHughes

En resumen NO - a menos que utilice el encubrimiento no es desanimado por Google.

Fuente

2009-09-30 11:08:08

-2

Existen metaetiquetas para bots, y también existe el robots.txt, con el que puede restringir el acceso a ciertos directorios.

Fuente

2009-09-30 11:08:53 Bobby

meta-tags y robots.txt ambos permiten o restringen el acceso a nivel de archivo, tengo curiosidad si puede permitir que una página se indexe, pero bloquee una parte determinada de ella. – ConroyP

-2

Todos los motores de búsqueda indexan o ignoran toda la página. La única manera posible de poner en práctica lo que se desea es:

(a) tener dos versiones diferentes de la misma página

(b) detectar el navegador utilizado

This link puede ser útil.

Fuente

2009-09-30 11:09:55 Anax

Esta es una buena forma de que su sitio sea excluido de Google – Greg

Indeed (http://www.google.com/support/webmasters/bin/answer.py?hl=es&answer=66355): "Sirviendo diferentes resultados basados en el agente de usuario puede hacer que su sitio sea percibido como engañoso y eliminado del índice de Google ". – Anax

-1

En su servidor, detecte el bot de búsqueda por IP usando PHP o ASP. Luego ingrese las direcciones IP que se encuentran en esa lista, una versión de la página que desea indexar. En esa versión amigable de motor de búsqueda de su página, use la etiqueta de enlace canónico para especificar al motor de búsqueda la versión de la página que no desea que se indexe.

De esta forma, la página con el contenido que desea indexar se indexará por dirección únicamente mientras se indexará el único contenido que desea indexar. Este método no te bloqueará por los motores de búsqueda y es completamente seguro.

Fuente

2009-09-30 11:16:56

Como se señala en un comentario separado, esto puede hacer que su sitio sea eliminado de Google. – Phrogz

Por favor, echa un vistazo a la documentación oficial de aquí

http://code.google.com/apis/searchappliance/documentation/46/admin_crawl/Preparing.html

Ve a la sección "Exclusión de texto no deseados del Índice"

<!--googleoff: index--> 
here will be skipped 
<!--googleon: index-->

Fuente

2011-12-23 12:35:52

Lamentablemente, esto solo se aplica a Google Search Appliance, no al sitio web público de Google. – Phrogz

-1

Sí definitivamente se puede dejar de Google indexe algunas partes de su sitio web al crear robots.txt personalizado y escribir qué partes no desea indexar como wpadmins, o una publicación o una página en particular, para que pueda hacerlo fácilmente al crear este archivo robots.txt. antes de crear el control y nuestro sitio robots.txt, por ejemplo www.yoursite.com/robots.txt.

Fuente

2014-01-31 06:45:06

Se encontró un recurso útil para usar cierto contenido duplicado y no permitir el índice por motor de búsqueda para dicho contenido.

Fuente

2017-02-12 18:45:06 Monazir

¿Hay alguna manera de evitar que Googlebot indexe ciertas partes de una página?

Respuesta

Cuestiones relacionadas