2009-12-29 19 views
12

estoy buscando la manera de evitar la indexación de partes de una página. Específicamente, los comentarios en una página, ya que pesan mucho las entradas en función de lo que escribieron los usuarios. Esto hace que una búsqueda en Google en la página devuelva muchas páginas irrelevantes.Los métodos para la prevención de los motores de búsqueda de la indexación de contenido irrelevante en una página

Estas son las opciones que estoy considerando hasta ahora:

1) carga comentarios usando JavaScript para evitar que los motores de búsqueda de verlas.

2) Utilice el rastreo de agente de usuario para no generar comentarios para los rastreadores.

3) Utilice el marcado del motor de búsqueda específico para ocultar partes de la página. Sin embargo, esta solución parece peculiar en el mejor de los casos. Supuestamente, esto se puede hacer para evitar Yahoo! índice de contenido específico:

<div class="robots-nocontent"> 
This content will not be indexed! 
</div> 

Cuál es una manera muy fea de hacerlo. He leído acerca de una solución de Google que se ve mejor, pero creo que sólo funciona con Google Search Appliance (alguien puede confirmar esto?):

<!--googleoff: all--> 
This content will not be indexed! 
<!--googleon: all--> 

¿Alguien tiene otros métodos para recomendar? ¿Cuál de los tres anteriores sería la mejor manera de hacerlo? Personalmente, me inclino por el n. ° 2 ya que si bien puede no funcionar para todos los motores de búsqueda, es fácil apuntar a los más grandes. Y no tiene ningún efecto secundario en los usuarios, a menos que intenten suplantar deliberadamente a un rastreador web.

+0

¿Qué hay de mostrar sus comentarios en un iframe (esencialmente otra página en total)? –

+0

Podría funcionar, si esa página se especifica como no indexada por los motores de búsqueda ... Pero se siente como una forma muy redonda de hacerlo ... Nunca fui fan de los iframes. – Blixt

+0

"Esto hace que una búsqueda en Google en la página devuelva muchas páginas irrelevantes". ¿Qué quiere decir con "Búsqueda de Google en la página"? La página debería aparecer en los resultados de Google cuando coincida con la consulta de búsqueda. ¿Le preocupa que su página aparezca con demasiada frecuencia? –

Respuesta

7

Me gustaría ir con la opción de JavaScript. Tiene dos ventajas:

1) bots no lo veo 2) aceleraría el tiempo de carga de la página (carga los comentarios de forma asíncrona y discreta, p. Ej. A través de jQuery) ... los tiempos de carga de la página son muy infravalorados efecto positivo en la búsqueda ranking

+2

Ya no es estrictamente cierto: los principales motores de búsqueda ahora pueden rastrear javascript. –

+1

Siempre que cargue los comentarios de manera asíncrona, este debe ser el camino a seguir. Como dijo Bob, muchos bots (incluido Google) ejecutan JavaScript limitado. Pero apuesto a que no harán el ajax e indexarán el resultado como parte de la página. –

2

googleoff y googleon son para el Google Search Appliance, que es un motor de búsqueda que venden a las empresas que necesitan buscar a través de sus propios documentos internos. No es efectivo para el sitio de Google en vivo.

creo que el número 1 es la mejor solución, en realidad. A los motores de búsqueda no les gusta cuando les das otro material que el que le das a tus usuarios para que el número 2 pueda sacarte por completo de los listados de búsqueda.

1

Ésta es la primera noticia que tengo de que los motores de búsqueda proporcionan un método para informarles de que parte de una página es irrelevante.

Google tiene una función para administradores de páginas web para declarar partes de su sitio para un motor de búsqueda web para utilizar para encontrar las páginas cuando se arrastra.

  1. http://www.google.com/webmasters/
  2. http://www.sitemaps.org/protocol.php

Usted puede ser capaz de relativamente restar importancia a algunas cosas en la página especificando las palabras clave más relevantes mediante la etiqueta (s) META en la sección HEAD de su HTML páginas. Creo que eso está más en línea con la filosofía de ingeniería utilizada para los motores de búsqueda de arquitecto en primer lugar.

Mire Google's Search Engine Optimization tips. Deletrean claramente lo que harán y no permitirán que hagas para influir en cómo indexan tu sitio.

3

Javascript es una opción pero los motores mejoran al leer Javascript, para ser honestos creo que piensas demasiado en eso, los motores adoran contenido único, cuanto más contenido tienes en cada página, mejor y si los usuarios están proporcionando es ... es el santo grial

El hecho de que su comentarista haya hecho referencia a star wars en su revisión de tostadora no significa que no vaya a clasificar para el modelo de tostadora, sino que significa que puede clasificar para Star Wars Tostador.

Otra idea sería, solo se pueden mostrar comentarios a las personas que están conectadas, collegehumor hace lo mismo, creo, muestran la cantidad de comentarios que tiene una publicación pero tienes que iniciar sesión para verlos.

+0

No creo que vea qué tan grande es la proporción de contenido de comentarios/páginas. Si busca, por ejemplo, "cómo registrarse", obtendría muchos comentarios sobre páginas irrelevantes, antes de obtener la página que contiene información sobre cómo registrarse. Simplemente porque de los cientos de comentarios que tienen algunas de las páginas, varios de ellos hablarán sobre el registro. – Blixt

+0

sí lo veo ahora, editando mi respuesta original –

Cuestiones relacionadas