Tengo mi blog (puede verlo si lo desea, desde mi perfil), y es fresco, así como los resultados de análisis de Google Robots son.¿Hay alguna manera de hacer que los robots ignoren cierto texto?
Los resultados fueron alarmantes para mí. Aparentemente las 2 palabras más comunes en mi sitio son "rss" y "feed", porque uso texto para enlaces como "Comentarios RSS", "Post Feed", etc. Estas 2 palabras estarán presentes en cada publicación, mientras que otras palabras será más raro
¿Hay alguna manera de hacer que estos enlaces desaparezcan del análisis de Google? No quiero enlaces técnicos indexados. Solo quiero que el contenido, los títulos y las descripciones se indexen. Estoy buscando algo más que reemplazar este texto con imágenes.
he encontrado algunos debates antiguos en Google, de vuelta de 2007 (creo que en 3 años, muchas cosas podrían haber cambiado, espero que esto también)
Esta pregunta no es acerca de robots.txt y cómo hacer caso omiso de Google páginas. Se trata de hacer que ignore partes pequeñas de la página, o transformar las partes de tal manera que sea visto por los humanos e invisible para los robots.
Parece legítimo. Sin embargo, la pregunta ha perdido su relevancia para mí. No puedo probarlo, pero en una búsqueda parece que esta es la solución. Lo marcó como tal, pero todos los que lean esto, sabrán que no ha sido probado hasta el momento. Más información de utk.edu http://google.utk.edu/ut-help/googleongoogleoff/ – AlexanderMP
Esto es para GSA, no para GoogleBot. de wikibedia: http://en.wikipedia.org/wiki/Noindex La principal araña de indexación de Google, Googlebot, no reconoce ninguna de estas técnicas. – Myster
'googleon',' googleoff'tags solo son compatibles con Google Search Appliance (cuando aloja sus propios resultados de búsqueda). Esto no evitará que Google bot rastree ese texto. – reversiblean