Me gustaría eliminar esas etiquetas con su contenido del código fuente HTML.Cómo buscar comentarios ("<!-- -->") con Jsoup?
Respuesta
Al buscar, básicamente utiliza Elements.select(selector)
donde selector
está definido por this API. Sin embargo, los comentarios no son elementos técnicamente, por lo que puede confundirse aquí, aún así son nodos identificados por el nombre de nodo #comment
.
Vamos a ver cómo podría funcionar:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Node;
public class RemoveComments {
public static void main(String... args) {
String h = "<html><head></head><body>" +
"<div><!-- foo --><p>bar<!-- baz --></div><!--qux--></body></html>";
Document doc = Jsoup.parse(h);
removeComments(doc);
doc.html(System.out);
}
private static void removeComments(Node node) {
for (int i = 0; i < node.childNodesSize();) {
Node child = node.childNode(i);
if (child.nodeName().equals("#comment"))
child.remove();
else {
removeComments(child);
i++;
}
}
}
}
que es bueno y el código de trabajo
doc.select("#comment").remove();
y por código quitar muchas etiquetas
doc.select("script, style, meta, link, comment, CDATA, #comment").remove();
'doc.select (" # comment "). Remove();' no funciona, no elimina los comentarios html. ¿Funcionó para ti? – yetanothercoder
'doc.select (" # comment "). Remove()' significa "Eliminar cualquier nodo que tenga el campo id es igual a 'comentario'." – Stephan
- 1. jquery buscar texto dentro <td>
- 2. Cómo mapear <C-/> para alternar comentarios en vim?
- 3. selector de CSS para buscar <select> con la etiqueta <option>
- 4. C# XML /// Comentarios, ¿dónde aparece <returns></returns> etiqueta?
- 5. Javascript y `<> ...</>` etiquetas
- 6. C# XML Comentarios: ¿Cuántas referencias de <see ... /> en comentarios XML son útiles?
- 7. <script></script> o <script />?
- 8. Aceptar rutas relativas en JSoup clean para <img> etiquetas
- 9. configuración log4j.xml con <rollingPolicy> y <triggeringPolicy>
- 10. Sincronización HTML5 <video> con <audio> reproducción
- 11. C# Acción <> con Func <> parámetro
- 12. <%# %> vs <%= %>
- 13. ¿Deberían los correos electrónicos HTML comenzar con <html><body><head> ...?
- 14. php: reemplazar el doble <br /> con</p><p>
- 15. ¿Por qué es Func <T> ambiguo con Func <IEnumerable <T>>?
- 16. ¿Tiene <script><!--//--></script> tiene un propósito moderno?
- 17. Jsoup - ¿Cómo limpiar html escapando no eliminando el html no deseado?
- 18. Cómo lanzar ArrayList <> de la lista <>
- 19. SortedList <>, SortedDictionary <> y Dictionary <>
- 20. Depuración visual utilizando >>,>,> |, ||, | <, <, <<
- 21. Cómo eliminar <hash></hash> de format.xml
- 22. Cómo deserializar Enumerable.ToList <>() a la lista <>
- 23. Cómo convertir un IEnumerable <IEnumerable <T>> a un IEnumerable <T>
- 24. <?> vs <T>
- 25. : <span> vs <label>
- 26. ¿Cómo encontrar la etiqueta de comentario <!--...--> con BeautifulSoup?
- 27. ObservableCollection <> vs. List <>
- 28. IEnumerable <> to IList <>
- 29. XSD Formateo <element><complexType> vs <complexType /><element/>
- 30. incluyendo <xstring>, <cstring>, <string> y <wstring> en C++
hmm esto me la está dando escriba error – user1893354
Si puede obtener una versión de Jsoup de 6 años, funcionó entonces. De lo contrario, si la API se actualiza, doy la bienvenida a las correcciones para actualizar este ejemplo. Parece que la lista childNodes se hizo inmodificable en alguna versión. –
dlamblin