Tengo cadenas codificadas en html en una base de datos, pero muchas de las entidades de caracteres no son solo las estándar &
y <
. Entidades como “
y —
. Lamentablemente, necesitamos alimentar estos datos en un lector de rss basado en flash y flash no lee estas entidades, pero sí leen el equivalente de Unicode (ex “
).Convertir entidades de caracteres a sus equivalentes Unicode
Usando .Net 4.0, ¿hay algún método de utilidad que convierta la cadena codificada en html para usar entidades de caracteres codificadas en unicode?
Aquí hay un mejor ejemplo de lo que necesito. El PP tiene cadenas HTML como: <p>John & Sarah went to see $ldquo;Scream 4$rdquo;.</p>
y lo que necesito para dar salida en el documento RSS/XML con la etiqueta <description>
es: <p>John &#38; Sarah went to see &#8220;Scream 4&#8221;.</p>
estoy usando un XmlTextWriter para crear el documento XML a partir de los registros de bases de datos similares a esta código de ejemplo http://www.dotnettutorials.com/tutorials/advanced/rss-feed-asp-net-csharp.aspx
Necesito reemplazar todas las entidades de caracteres dentro de la cadena html de la base de datos con su equivalente unicode porque el lector de rss basado en flash no reconoce ninguna entidad más allá de las más comunes como &
.
¿Estás seguro de que necesita carácter * * entidades en el primer lugar? ¿Por qué no usar los caracteres * unicode * * reales? –