2012-09-23 34 views
5

Tengo una pregunta acerca de Charset.forName (String charsetName). ¿Hay una lista de charsetNames a los que me refiero? Por ejemplo, para UTF-8, usamos "utf8" para charsetName. ¿Qué pasa con WINDOWS-1252, GB18030, etc.?Codificación CharsetNames para Charset.forName (Cadena)

+2

http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html y la última http://download.java.net/jdk8/docs/technotes/guides /intl/encoding.doc.html – nullpotent

+0

También hay una buena discusión en http://stackoverflow.com/questions/1684040/java-why-charset-names-are-not-constants –

Respuesta

5
 
Charset   Description 

US-ASCII  Seven-bit ASCII, a.k.a. ISO646-US, a.k.a. the Basic Latin block of the Unicode character set 
ISO-8859-1  ISO Latin Alphabet No. 1, a.k.a. ISO-LATIN-1 
UTF-8   Eight-bit UCS Transformation Format 
UTF-16BE  Sixteen-bit UCS Transformation Format, big-endian byte order 
UTF-16LE  Sixteen-bit UCS Transformation Format, little-endian byte order 
UTF-16   Sixteen-bit UCS Transformation Format, byte order identified by an optional byte-order mark 

Referencia: http://docs.oracle.com/javase/7/docs/api/java/nio/charset/Charset.html

2

Los nombres de conjunto de caracteres en Java son dependientes de la plataforma, hay sólo 6 constantes de la clase StandardCharsets.

Para ver todos los conjuntos de caracteres, debe mirar IANA. Marque las columnas Preferidas nombre MIME y alias.

Cuestiones relacionadas