2008-12-10 23 views
10

Estoy importando algunos datos de otra prueba/herramienta de seguimiento de errores en tfs, y me gustaría convertir su descripción, que es en HTML simple, por lo que un simple cadena, donde se preserva el 'diseño' del HTML.Renderizar o convertir HTML a texto 'formateado' (.NET)

Por ejemplo:

<body> 
    <ol> 
    <li>Log on with user Acme &amp; Co.</li> 
    <li>Navigate to the details tab</li> 
    <li>Check the official name</li> 
    </ol> 
    <br> 
    <br> 
    Expected Result:<br> 
    official name is filled in<br> 
    <br> 
    Actual Result:<br> 
    The &amp;-sign is not shown correctly<br> 
    See attachement. 
</body> 

se convertiría en texto plano con saltos de línea insertados y-entidades HTML traducidos como:

 
1. Log on with user Acme & Co. 
2. Navigate to the details tab 
3. Check the official name 

Expected Result: 
official name is filled in 

Actual Result: 
The &-sign is not shown correctly 
See attachment 

puedo reemplazar Actualmente algunas etiquetas con saltos de línea usando una expresión regular y tira el resto , pero reemplazar las entidades HTML y cosas como <ol> y <ul> parecía que estoy reinventando algo (¿navegador?). Entonces me preguntaba si alguien hizo esto antes que yo. No puedo encontrarlo usando Google.

Respuesta

0

Al final, una vez que me sentí más cómodo con TFS, personalicé el tipo de elemento de trabajo para incluir un nuevo campo de HTML, y simplemente copié los contenidos en ese campo.

Esta solución era mucho mejor, porque ahora podíamos ver el formato previsto del campo.

5

En lugar de regex, podrías intentar cargarlo en el HTML agility pack? Si era xhtml, entonces una transformación xslt podría ser una buena opción.