La idea básica detrás del formato MS Word DOC es un documento OLE Compund que, como Kibbee ya ha escrito, es básicamente un volcado de memoria. Es una forma muy compleja e intrincada de almacenar documentos, pero si alguna vez has profundizado en la aplicación Word sabrás lo increíblemente muchas características que tiene, y si lo has usado en un entorno de negocios, tendrás una buena sintiendo cómo se integra con otros programas en la serie de Office.
En general, los documentos OLE Compund son estructuras muy extensibles que le permiten almacenar todo tipo de datos en un archivo e incluso manejar en cierta medida los datos para los que no tiene una aplicación instalada. Por ejemplo, si inserta un objeto Ecuación (desde el Editor de ecuaciones MS) en un documento, se almacena como un subobjeto que es como un archivo dentro del archivo, pero este objeto no solo contiene los datos necesarios para el Editor de ecuaciones. para editarlo y renderizarlo, también tiene una representación genérica de mapa de bits (o metarchivo, tal vez) almacenada para que se pueda mostrar, aunque no se edite, en una máquina sin el Editor de ecuaciones instalado.
Esta fue la razón por la , por la forma en que tendrá que leer las especificaciones que otras personas han vinculadas al ya;)
Si desea que el camino más fácil para trabajar con los archivos, sin embargo, asegúrese de que su software se ejecute en una máquina Windows con Word instalado, luego use Automatización COM/OLE para abrir y manipular los documentos. Entonces no tendrá que preocuparse por el formato de archivo.
Es binario, y la especificación está disponible bajo los términos de [Promesa de especificación abierta de Microsoft] (http://en.wikipedia.org/wiki/Microsoft_Open_Specification_Promise) –