Aquí es una expresión regular a largo grande para que coincide con una URL:
(?i)\b((?:(?:[a-z][\w-]+:)?(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:'".,<>?«»“”‘’]))
La versión expandida de que (a ayudar a hacer más comprensible):
(?xi)
\b
( # Capture 1: entire matched URL
(?:
(?:[a-z][\w-]+:)? # URL protocol and colon
(?:
/{1,3} # 1-3 slashes
| # or
[a-z0-9%] # Single letter or digit or '%'
# (Trying not to match e.g. "URI::Escape")
)
| # or
www\d{0,3}[.] # "www.", "www1.", "www2." … "www999."
| # or
[a-z0-9.\-]+[.][a-z]{2,4}/ # looks like domain name followed by a slash
)
(?: # One or more:
[^\s()<>]+ # Run of non-space, non-()<>
| # or
\(([^\s()<>]+|(\([^\s()<>]+\)))*\) # balanced parens, up to 2 levels
)+
(?: # End with:
\(([^\s()<>]+|(\([^\s()<>]+\)))*\) # balanced parens, up to 2 levels
| # or
[^\s`!()\[\]{};:'".,<>?«»“”‘’] # not a space or one of these punct chars
)
)
Estos dos vienen de this page, pero modificado ligeramente para hacer que el protocolo sea opcional, debería leer esa página para ayudar a entender lo que está haciendo, y también tiene una variante que solo coincide con las URL basadas en la web, que también puede consultar.
Gracias por todas sus respuestas. Funcionó muy bien. – NLV
Todos sus Regex están aceptando @@ ## $$ como una URL válida. ¿Algunas ideas? – NLV
NLV, no especificó que quería que corrijáramos su expresión regular, solo le preguntó cómo cambiarla para aceptar cualquier protocolo. De todos modos, vea mi nueva respuesta a continuación que proporciona una expresión regular (y compleja) de validación de URL. –