2010-05-04 15 views
5

Estamos en la necesidad de convertir todos los documentos de MS Office a PDF, TIFF o cualquier formato de imagen similar sin pérdida de formato (estos son documentos oficiales que no pueden someterse a la manipulación).documentos de Office Convert sin Office

¿Hay alguna manera de hacer esto sin necesidad de instalar Office en la máquina que había de hacer esto? Idealmente, esto iría en un servidor y ejecutaría múltiples subprocesos sin la sobrecarga de Office Automation.

Respuesta

3

Puede usar una biblioteca de terceros como Aspose.NET para la conversión de documentos, pero me temo que si la reproducción de alta fidelidad es crítica, no hay forma de evitar el uso de la aplicación original.

Microsoft Office proporciona una API convertidor que permite conversiones sin Office está instalando. Sin embargo, no solo puede enfrentar problemas de licencia (IANAL), esta API solo admite conversiones de formatos de procesamiento de texto que no requieren procesar el documento (por ejemplo, RTF -> DOC, DOC -> DOCX), por lo que no es realmente una opción para ti.

Actualización: Probablemente la mejor opción sería tener una mirada en el motor de conversión de SharePoint 2010, que está hecho precisamente para las conversiones (del lado del servidor) de documentos automatizados. Aunque es bastante pesado (tanto hardware como precios), tal vez sea excesivo para su caso de uso.

+0

Es curioso que lo mencionas Aspose, debido a que su herramienta parece tener exactamente el mismo problema que estoy corriendo en la Office Open XML (el error próxima es siempre un intento de .Net para establecer el tamaño máximo de un arroyo, desencadenada por algo que está haciendo un xmlwriter). – MusiGenesis

0

Si esta aplicación se ejecutará en una máquina dedicada (es decir, el único trabajo de la máquina es convertir una colección gigantesca de documentos de Office), la apuesta más segura es usar la automatización de Office de una sola vez y dejar que la aplicación felizmente convertir un archivo a la vez. Una aplicación de automatización de Office de subprocesos múltiples probablemente convierta los documentos a un ritmo general más rápido (especialmente en un procesador de varios núcleos), hasta el punto en que el servidor falle.

Office Open XML no es una alternativa de automatización de Office, pero como actualmente estoy luchando contra su tendencia a producir errores OutOfMemoryException al exportar a archivos de Excel relativamente pequeños (~ 1MB), realmente no puedo recomendarlo.

Cuestiones relacionadas