2012-04-19 15 views
36

¿Cómo puedo encontrar el archivo sitemap.xml de sitios web?¿Cómo encontrar la ruta de sitemap.xml en los sitios web?

p. Ej. El ir a stackoverflow/sitemap.xml me consigue un 404.

En stackoverflow/robots.txt está escrito lo siguiente:

"esta técnica no es válida, ya que por alguna razón de mala muerte caminos mapa debe ser absoluto y no relativa. Sitemap: /sitemap.xml "

+0

Me pregunto si hay alguna solución usando la opción 'Right click -> Inspect' de google chrome. – rraadd88

Respuesta

14

No creo que haya un estándar en cuanto a la ubicación del mapa del sitio. Esa es la razón por la que debe especificar una URL arbitraria para su mapa del sitio cuando agrega una usando las Herramientas para webmasters de Google.

2

Según protocol documentation hay al menos tres opciones diseñadores de sitios web pueden utilizar para informar a la ubicación sitemap.xml a los motores de búsqueda:

  • Informar a cada motor de búsqueda de la ubicación a través de su interfaz proporcionada
  • Adición de URL para el archivo robots.txt
  • Presentando url para los motores de búsqueda a través de http

Por lo tanto, a menos que hayan decidido publicar la ubicación del mapa del sitio en su archivo robots.txt, no se puede saber realmente dónde han colocado sus archivos sitemap.xml.

+4

4ª opción: Listar [ubicación del sitio múltiple] (http://www.sitemaps.org/protocol.html#sitemapIndexXMLExample) en el índice sitemap.xml especificado en robots.txt. – hyip

77

No hay un estándar, por lo que no hay garantía. Con eso dicho, su común para el mapa del sitio para ser auto etiquetados y en la raíz, así:

example.com/sitemap.xml

Caso es sensible en algunos servidores, así que tenlo en cuenta. Si no es aquí, busque en los robots presentar en la raíz:

example.com/robots.txt

Si no aparece en la lista de los robots presentar la cabeza a Google y buscar esto:

site:example.com filetype:xml

Esto limitará los resultados a archivos XML en su dominio de destino. En este punto es de prueba y error y se basa en los detalles del sitio web con el que está trabajando. Si obtiene varias páginas de resultados de búsqueda en Google la frase anterior, entonces tratar de limitar aún más los resultados:

filetype:xml site:example.com inurl:sitemap

o

filetype:xml site:example.com inurl:products

Si todavía no lo encuentra que pueda right-click > "View Source" y hacer una búsqueda (también conocido como "control find" o Ctrl + F) para .xml para ver si hay una referencia en el código.

+3

+1 para buscar en el archivo robots.txt: esto representa los sitios que no tienen un sitemap.xml en el directorio raíz. Ahora para el otro 20% ... – FredTheWebGuy

Cuestiones relacionadas