No quiero que los motores de búsqueda indexen mi página de impresión. ¿Cómo podría hacer eso?¿Cómo evitar que los motores de búsqueda indexen una sola página de mi sitio web?
Respuesta
Necesita un archivo simple robots.txt
. Básicamente, es un archivo de texto que le dice a los motores de búsqueda que no indexen páginas particulares.
No necesita incluirlo en el encabezado de su página; siempre que esté en el directorio raíz de su sitio web, será rastreado por los rastreadores.
crear en la carpeta raíz de su sitio web y poner el texto siguiente en:
User-Agent: *
Disallow: /imprint-page.htm
Tenga en cuenta que desea reemplazar imprint-page.html
en el ejemplo con el nombre real de la página (o el directorio) que desea para evitar ser indexado
Eso es todo! Si desea obtener más avanzada, puede consultar here, here o here para obtener más información. Además, puede encontrar herramientas gratuitas en línea que generarán un archivo robots.txt
(por ejemplo, here).
Aquí hay un buen tutorial: http://www.javascriptkit.com/howto/robots.shtml –
¡Gracias Sam! Agregó su enlace al lado del otro tutorial. – Donut
¡Muchas gracias! ¿Debo incluir robots.txt en algún lugar del encabezado? ¿O es suficiente simplemente colocarlo en la raíz del sitio web? –
Puede configurar un archivo robots.txt para intentar que los motores de búsqueda ignoren ciertos directorios.
Básicamente:
User-agent: *
Disallow: /[directory or file here]
también usted puede añadir siguiente etiqueta meta en la mente de esa página
<meta name="robots" content="noindex,nofollow" />
buena idea. Hizo esto adicionalmente –
Esta es una solución mejor que usar robots.txt. La razón es que si elimina una página de robots.txt, los motores de búsqueda ni siquiera visitarán la página. Si hay enlaces que apuntan a la página, no la eliminarán del índice porque no se los indicó. Google mostrará la página sin una descripción, porque conocen la página pero no saben qué hay en la página. La única manera de eliminarlo explícitamente del índice es decirle a los motores que no desea que se muestre con el comando 'noindex'. – eywu
Esto es un problema (demasiado tiempo para codificar) si el encabezado se incluye dinámicamente como idioma del lado del servidor como php, que será el mismo para todas las páginas. –
Crear un archivo robots.txt y coloque los controles allí.
Éstos son los documentos de Google: http://code.google.com/web/controlcrawlindex/docs/robots_txt.html
Hoy en día, el mejor método es utilizar un robots meta tag y ponerlo a noindex,follow
:
<meta name="robots" content="noindex, follow">
<meta name="robots" content="noindex, nofollow">
basta con incluir esta línea en su <html>
<head>
etiqueta. Por qué le digo esto porque si usa el archivo robots.txt para ocultar sus URL que podrían ser páginas de inicio de sesión u otras URL protegidas que no se mostrarán a otra persona ni a los motores de búsqueda.
Lo que puedo hacer es acceder al archivo robots.txt directamente desde su sitio web y puedo ver qué URLs tiene son secretas. Entonces, ¿cuál es la lógica detrás de este archivo robots.txt?
La buena manera es incluir la metaetiqueta desde arriba y mantenerse a salvo de nadie.
Un robot quiere visitar un sitio web URL, digamos http://www.example.com/welcome.html. Antes de hacerlo, se primicias cheques por http://www.example.com/robots.txt, y encuentra: puede prohibir explícitamente:
User-agent: *
Disallow: /~joe/junk.html
visite a continuación enlace de datos robots.txt
- 1. ¿Cómo logro que los motores de búsqueda indexen todas las variantes de idioma de una página?
- 2. ¿Cómo evitar que los motores de búsqueda rastreen todo el sitio web?
- 3. ¿Cómo detengo los motores de búsqueda indexando una página de mantenimiento
- 4. haciendo posible el contenido generado por JavaScript para que los motores de búsqueda indexen
- 5. ¿Cómo oculto un sitio de los motores de búsqueda?
- 6. cómo ocultar completamente el sitio web de los motores de búsqueda?
- 7. cómo hacer que mi sitio se vea en la siguiente imagen en los resultados de los motores de búsqueda
- 8. Cómo evitar enlaces profundos a archivos en mi sitio web
- 9. ¿Cómo decirle a los motores de búsqueda que 2 nombres de dominio son el mismo sitio web?
- 10. ¿Cómo resalta un sitio web los términos de búsqueda que utilizó en el motor de búsqueda?
- 11. ¿Cómo mostrar los resultados de búsqueda de Google incrustados en mi sitio web?
- 12. ¿Cuáles son las ventajas y desventajas de un sitio web que contiene una sola página?
- 13. ¿Contando el número de visitas de una página ignorando los motores de búsqueda?
- 14. Los motores de búsqueda no pueden indexar el sitio asp.net debido a los 302 redireccionamientos a la página de error
- 15. cómo proteger mi sitio web
- 16. cómo hacer un motor de búsqueda para el sitio web?
- 17. Cómo hacer que Google búsqueda Mostrar mi sitio como este
- 18. Los métodos para la prevención de los motores de búsqueda de la indexación de contenido irrelevante en una página
- 19. ¿Cómo puedo evitar que mi sitio asp.net sea filtrado?
- 20. ¿Cómo puedo agregar una búsqueda integrada de Google a mi sitio web?
- 21. ¿Cómo evitar que los usuarios inicien sesión en mi sitio más de una sesión?
- 22. ¿Cómo controlar una aplicación web de una sola página?
- 23. ¡Todo el sitio web secuestrado! ¿Cómo evitar ser secuestrado?
- 24. ¿Puedo evitar que Java EE cree una página web liviana?
- 25. Actualizar los resultados de búsqueda de Google para Mi sitio
- 26. ¿Cómo puede evitar el sistema de eventos Tridion 2011 que se publique una sola página?
- 27. Código de Ruby para comprobar si un sitio web tiene URLs compatibles con los motores de búsqueda
- 28. ¿Cómo puedo hacer que mis registros de base de datos mysql sean visibles para los motores de búsqueda?
- 29. ¿Cómo restrinjo los scripts de greasemonkey de cromo a una sola página web o solo a determinadas páginas web?
- 30. ¿Los elementos HTML5 significan algo para los motores de búsqueda?
https: // CSS-trucos.com/snippets/html/meta-tag-to-prevention-search-engine-bots/ – zloctb