2012-10-05 41 views
7

Quiero saber cuál es la solución oficial para el procesamiento de XML Unicode en Haskell. Observé que HXT usa una representación simple String (¡una lista de caracteres Unicode!) Para texto.¿Cuál es la actitud de Haskell hacia Unicode en XML?

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors 
XText String ordinary text (leaf) 
XBlob Blob   text represented more space efficient as bytestring (leaf) 

¿cómo elegir entre las dos representaciones al analizar? Obligar al usuario a usar listas de caracteres no suena como una característica particularmente atractiva, especialmente si los documentos XML tienen mucho contenido de texto.

Además, encontré http://hackage.haskell.org/package/hxt-unicode en Google, pero no estoy seguro de cómo se pretende utilizar con el análisis. El soporte para Unicode solía ser mucho más explícito también: http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html pero este módulo se ha eliminado en la última versión (9.3.1.0 en el momento de la escritura) sin una razón clara. ¿Cuál fue la motivación detrás de eso?

¿Podría alguien dar algún ejemplo de código, también, de cómo HXT está destinado a ser utilizado, por favor? Las páginas de wiki carecen seriamente en este respecto. Gracias.

+0

¿Qué oficina anunciaría la "solución oficial para procesar Unicode XML en Haskell"? Acerca de HXT, que no pretendo recomendar, hay ejemplos de archivos en todo el origen: https://github.com/UweSchmidt/hxt. – applicative

Respuesta

3

El paquete xml-conduit utiliza el tipo de datos Text para almacenar datos textuales. Se ha convertido en la representación estándar de datos textuales en los últimos años. xml-conduit es un paquete bien mantenido, y lo he usado personalmente para una gran cantidad de código abierto y código comercial.

Cuestiones relacionadas