Estoy buscando una forma rápida de analizar las etiquetas HTML de una cadena ColdFusion. Estamos obteniendo un feed RSS que potencialmente podría contener algo. Entonces estamos manipulando la información y luego escupiéndola a otro lugar. Actualmente estamos haciendo esto con una expresión regular. ¿Hay una mejor manera de hacer esto?¿Cómo puedo eliminar etiquetas HTML de una cadena ColdFusion?
<cfloop from="1" to="#ArrayLen(myFeed.item)#" index="i">
<cfset myFeed.item[i].description.value =
REReplaceNoCase(myFeed.item[i].description.value, '<(.|\n)*?>', '', 'ALL')>
</cfloop>
Estamos utilizando ColdFusion 8.
He encontrado <[^>] *> como una posible expresión regular modificada. ¿Qué ventaja ofrece la segunda mitad de los suyos? – Jason
Como dije: Captura etiquetas no cerradas al final de la cadena. "(?:> | $)" se lee como "un corchete de etiqueta de cierre o el final de la cadena". El resto de la expresión regular es equivalente a la alternativa que has encontrado. "[^>] *" generalmente es más recomendable que "(. | \ n) *?", porque es más explícito y es más rápido. – Tomalak
Recomiendo hacer una segunda pasada para reemplazar con >, porque es posible que tenga algunas sobras. –
Kip