Quiero eliminar etiquetas HTML de una Cadena. Esto es fácil, lo sé, por lo que hice:Eliminar algunas etiquetas HTML con RegExp y Java
public String removerTags(String html)
{
return html.replaceAll("\\<(/?[^\\>]+)\\>", " ").replaceAll("\\s+", " ").trim();
}
El problema es que no quiero para eliminar todas las etiquetas .. Quiero la etiqueta
<span style=\"background-color: yellow\"> (text) </ span>
estancia en la cadena intacta ..
estoy usando esto como una especie de "destacado" en la búsqueda de una aplicación web usando GWT que estoy haciendo ...
Y necesito hacer esto, ya que si la búsqueda encuentra te xt que contiene alguna etiqueta HTML (la indexación es hecha por Lucene), y está rota, el appendHTML de safeHTMLBuilder no puede montar una Cadena.
¿Puedes hacer esto de una manera bastante buena?
Abrazos.
Estas preguntas son muy frecuentes en estos días. ¿Por qué no podemos agrupar preguntas similares juntas? * # SO tip *;) –
ese es el verdadero hombre. – caarlos0
Asegúrese de tener en cuenta los valores de referencia de entidad también. – Edward