Tengo un poco de contenido de texto con una lista de URL contenidas en él.Extraer todas las direcciones URL dentro de una cadena en Ruby
Estoy tratando de tomar todas las direcciones URL y ponerlas en una matriz.
tengo este código
content = "Here is the list of URLs: http://www.google.com http://www.google.com/index.html"
urls = content.scan(/^(http|https):\/\/[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(([0-9]{1,5})?\/.*)?$/ix)
Estoy tratando de obtener los resultados finales sean:
['http://www.google.com', 'http://www.google.com/index.html']
El código anterior no parece estar funcionando correctamente. ¿Alguien sabe lo que estoy haciendo mal?
Gracias
Le daré la simplicidad. Esto bien puede ser todo lo que se necesita. – Chowlett
¡Me gradué de esa escuela! –
Este enfoque omitirá muchas URL válidas y seleccionará incorrectamente muchas URL inválidas. – sferik