Mi idea es de alguna manera minificar el código HTML en el lado del servidor, por lo que el cliente recibe menos bytes.Cómo minimizar el código HTML?
¿Qué quiero decir con "minify"?
No comprimiendo. Más como, por ejemplo, los creadores de jQuery lo hacen con .min .js versiones. En otras palabras, necesito eliminar los espacios en blanco y las líneas nuevas innecesarios, pero no puedo eliminar tanto la presentación de los cambios HTML (por ejemplo, eliminar el espacio en blanco entre las palabras reales en el párrafo).
¿Hay alguna herramienta que pueda hacerlo? Sé que hay HtmlPurifier. ¿Es capaz de hacerlo? ¿Alguna otra opción?
P.S. Por favor no ofrezcas expresiones regulares. Sé que solo Chuck Norris puede analizar HTML con ellos. =]
No creo que tiene que hacer esto. La mayoría de los servidores web admiten la publicación de páginas web "gzipped". Tus espacios en blanco ya no serán un problema. Siempre debe publicar sus páginas web con gzip. –
Puede escribir un programa simple que utiliza una biblioteca de análisis HTML para analizar el archivo HTML y luego volver a escribirlo. Si usa C#, puede mirar la biblioteca LINQ-to-HTML. –
Estoy de acuerdo con Stephen Chung: si descomprimes el código HTML, se compactarán todos los espacios en blanco. Será un proceso más rápido que arreglar el HTML en sí mismo. – bart