Estoy escribiendo un programa que lee y separa los correos electrónicos no deseados y no deseados. Ahora lo estoy leyendo usando una clase de java bufferreayer. Soy capaz de eliminar todos los caracteres deseados como '(' o '', etc, utilizando el método replaceAll(). Quiero quitar las etiquetas HTML también, incluyendo & amplificador. ¿Cómo lograr esto !?eliminar las etiquetas html de la cadena usando Java
gracias
EDIT: Gracias por la respuesta, pero yo ya estoy teniendo una expresión regular, cómo combinar ambas mis necesidades y se pone en una Heres la expresión regular que estoy utilizando ahora
lines.replaceAll("[^a-zA-Z]", " ")
Nota:.. que estoy recibiendo líneas de un archivo de texto. Cualquier otra sugerencia por favor ?!
me trataron Jsoup..but no es working..no error complile, sus simplemente no funcionan .. – Maverick
Temas similares http://stackoverflow.com/questions/1699313/how-to-remove-html -tag-in-java http://stackoverflow.com/questions/240546/removing-html-from-a-java-string –