Estoy desarrollando una aplicación en rieles que requiere comprobar si el sitio web ingresado tiene URLs amigables para los motores de búsqueda generadas o no. Una solución que tengo en mente es usar nokogiri para analizar el código HTML del sitio y busque en la etiqueta del enlace para encontrar las URL y ver si son compatibles con los motores de búsqueda. ¿Hay alguna otra forma de hacerlo? Cualquier ayuda sería realmente genial.Código de Ruby para comprobar si un sitio web tiene URLs compatibles con los motores de búsqueda
Respuesta
Usted tiene dos problemas:
¿Cómo formalmente (mediante programación) definir qué es una "búsqueda URL frienldy motor está". Supongo que ya tienes una forma de hacerlo. Entonces eso deja ...
Cómo verificar todos los enlaces en un sitio web.
Así que para (2) Me gustaría ver algo así como Anemone lo que hará más fácil para usted para arrastrarse sitios web completos:
anémona es una biblioteca de Ruby que hace que sea rápido y sin dolor para escribir programas que arañan un sitio web. Proporciona una DSL simple para realizar acciones en cada página de un sitio, omitir ciertas URL y calcular la ruta más corta a una página determinada en un sitio.
El diseño de múltiples hilos hace Anemone rápido. La API lo hace simple. Y la expresividad de Ruby lo hace poderoso.
Para un simple arrastre Anemone incluso le dará una selección de todos los enlaces en una página, por lo que no necesariamente necesitará Nokogiri. Para cosas más complejas quizás quieras combinar Anemone con algo como Mechanize y Nokogiri. Eso depende de tus requisitos.
Gracias por compartir información acerca de la gema Anemone, sería muy útil para mí. Tampoco he encontrado la manera de resolver el (1) problema, así que si tiene ayuda sobre eso, por favor comparte eso también. –
Anemone es increíble, resuelve mi propósito aquí, Gracias –
@JimmyThakkar - Gracias por sus comentarios. Lamentablemente, no, no tengo buenas ideas para los enlaces de SEO. No es un problema fácil de resolver. Lo que haría sería escribir primero en papel qué buen enlace de SEO es. Es decir. crear una definición en papel primero! Después de eso, podrías intentar y formular un algoritmo para ello. Pero primero debes tener las reglas claras. Tal vez busque palabras clave que coincidan en la página, etc. Sin embargo, los seres humanos pueden ver rápidamente si un enlace es SEO o no. Por lo tanto, al implementar (2) ya puede enumerar los enlaces y escanear rápidamente más de 100 enlaces en tan solo unos segundos con solo mirarlos. – Casper
- 1. ¿Cómo oculto un sitio de los motores de búsqueda?
- 2. Sitio web de Parse para URLs
- 3. ¿Cómo evitar que los motores de búsqueda rastreen todo el sitio web?
- 4. cómo hacer un motor de búsqueda para el sitio web?
- 5. cómo ocultar completamente el sitio web de los motores de búsqueda?
- 6. ¿Cómo evitar que los motores de búsqueda indexen una sola página de mi sitio web?
- 7. ¿Los elementos HTML5 significan algo para los motores de búsqueda?
- 8. ¿Cómo decirle a los motores de búsqueda que 2 nombres de dominio son el mismo sitio web?
- 9. Comprobar si existe una URL en Ruby
- 10. ¿Qué código de estado HTTP es más amigable con los motores de búsqueda durante una interrupción planificada?
- 11. ¿Puedo bloquear los rastreadores de búsqueda para cada sitio en un servidor web Apache?
- 12. ¿Los motores de búsqueda agregan peso a los microformatos?
- 13. ¿Cómo resalta un sitio web los términos de búsqueda que utilizó en el motor de búsqueda?
- 14. ¿Por qué los motores de búsqueda ignoran los símbolos?
- 15. Comprobar si XML-node tiene un atributo con Linq C#?
- 16. ¿Los motores de búsqueda penalizarán el texto oculto por javascript?
- 17. ¿Cómo logro que los motores de búsqueda indexen todas las variantes de idioma de una página?
- 18. ¿Pueden los motores de búsqueda indexar páginas web generadas en JavaScript?
- 19. Implementación de búsqueda en un sitio web de ASP.NET MVC
- 20. Comprobar si Html.ValidationSummary() tiene un valor
- 21. ¿Puedo usar WGET para generar un mapa del sitio de un sitio web dada su URL?
- 22. Ejemplo de motores de aplicaciones de Google (python, Django) sitios web con código abierto
- 23. URLs redirigir al sitio de spyware
- 24. Un sitio web usando Ruby solo
- 25. ¿Cómo comprobar si se encontró una imagen en un sitio web?
- 26. ruby: código para instalar gema si falta
- 27. ¿Cuáles son los motores de búsqueda de código abierto que conoces?
- 28. ¿Se pueden usar los contratos de código de Microsoft con un sitio web ASP.NET?
- 29. Agregar la búsqueda de un sitio web privado
- 30. ¿Los motores de búsqueda captarán palabras clave y metaetiquetas de descripción generadas mediante JavaScript?
si realmente desea ver todos los enlaces en la página, nokogiri es el camino a seguir. ¿Cómo planeas distinguir una URL amigable para SEO de una que no sea amigable para SEO? –
No tengo ni idea de cómo lo haría. Primero buscaré en Anemone como lo sugirió @Casper. ¿Hay alguna otra manera que podría funcionar para este caso? Gracias –
Desafortunadamente no, solo estaba siendo curioso; -) –