2009-09-30 22 views
10

¿Es posible ajustar las directivas a Google a tal punto que ignorará parte de una página y aún así indexará el resto?¿Hay alguna manera de evitar que Googlebot indexe ciertas partes de una página?

Hay un par de cuestiones diferentes que hemos encontrado que ser ayudado por esta, tales como:

  • RSS feed texto/noticias de tipo ticker en una página de visualización del contenido de una fuente externa
  • usuarios que entran en detalles de teléfono de contacto, etc. que quieren hacerlos visibles en el sitio, pero prefieren no ser capaces google-

soy consciente de que las dos anteriores se pueden abordar a través de otras técnicas (como la escritura el contenido con JavaScript), pero me pregunto si alguien sabe si hay una opción más limpia disponible de Google?

He estado investigando sobre esto y he encontrado menciones de googleon and googleoff tags, pero estas parecen ser exclusivas de Google Search Appliances.

¿Alguien sabe si hay un conjunto similar de etiquetas a las que se adherirá Googlebot?

Editar: Solo para aclarar, no quiero pasar por la peligrosa ruta de encubrir/servir contenido diferente a Google, por lo que estoy buscando ver si hay una forma "legítima" de logrando lo que me gustaría hacer aquí.

Respuesta

9

Lo que estás pidiendo, realmente no se puede hacer, Google toma toda la página, o nada de eso.

Podrías hacer algunos trucos furtivos como insertar la parte de la página que no quieres indexada en un iFrame y usar robots.txt para pedirle a Google que no indexe ese iFrame.

1

En resumen NO - a menos que utilice el encubrimiento no es desanimado por Google.

-2

Existen metaetiquetas para bots, y también existe el robots.txt, con el que puede restringir el acceso a ciertos directorios.

+0

meta-tags y robots.txt ambos permiten o restringen el acceso a nivel de archivo, tengo curiosidad si puede permitir que una página se indexe, pero bloquee una parte determinada de ella. – ConroyP

-2

Todos los motores de búsqueda indexan o ignoran toda la página. La única manera posible de poner en práctica lo que se desea es:

(a) tener dos versiones diferentes de la misma página

(b) detectar el navegador utilizado

(c) Si se trata de un motor de búsqueda , sirve la segunda versión de tu página.

This link puede ser útil.

+6

Esta es una buena forma de que su sitio sea excluido de Google – Greg

+2

Indeed (http://www.google.com/support/webmasters/bin/answer.py?hl=es&answer=66355): "Sirviendo diferentes resultados basados ​​en el agente de usuario puede hacer que su sitio sea percibido como engañoso y eliminado del índice de Google ". – Anax

-1

En su servidor, detecte el bot de búsqueda por IP usando PHP o ASP. Luego ingrese las direcciones IP que se encuentran en esa lista, una versión de la página que desea indexar. En esa versión amigable de motor de búsqueda de su página, use la etiqueta de enlace canónico para especificar al motor de búsqueda la versión de la página que no desea que se indexe.

De esta forma, la página con el contenido que desea indexar se indexará por dirección únicamente mientras se indexará el único contenido que desea indexar. Este método no te bloqueará por los motores de búsqueda y es completamente seguro.

+1

Como se señala en un comentario separado, esto puede hacer que su sitio sea eliminado de Google. – Phrogz

-1

Sí definitivamente se puede dejar de Google indexe algunas partes de su sitio web al crear robots.txt personalizado y escribir qué partes no desea indexar como wpadmins, o una publicación o una página en particular, para que pueda hacerlo fácilmente al crear este archivo robots.txt. antes de crear el control y nuestro sitio robots.txt, por ejemplo www.yoursite.com/robots.txt.

0

Se encontró un recurso útil para usar cierto contenido duplicado y no permitir el índice por motor de búsqueda para dicho contenido.

Cuestiones relacionadas