2009-10-26 19 views
32

Tengo un requisito donde necesito guardar documentos HTML en la memoria como archivos .DOC de Word.Cómo convertir archivos HTML a palabras?

¿Alguien me puede dar algunos enlaces a bibliotecas de código abierto y abierto que pueda usar para hacer esto?

Además, debería editar esta pregunta para agregar el idioma que estoy usando a fin de reducir las opciones.

Gracias!

+6

Todo es posible. ¿Cuánto dinero en efectivo desea gastar en esto? – Will

+2

Ahora es una pregunta real. – Will

+1

@Mask: Sí, especifique qué idioma está usando. – Alan

Respuesta

4

Una buena opción es utilizar una API como Docverter. Docverter le permitirá convertir HTML a PDF o DOCX utilizando una API.

+12

¿Olvidaste terminar tu respuesta? –

+3

Aunque la respuesta es inacabada, imo Docverter ha demostrado ser la información más útil de esta página :) – Owen

4

Al hacer esto me pareció más fácil de:

  1. Visita la página en un navegador web
  2. Guardar la página utilizando el navegador web con la extensión .htm (y tal vez una carpeta con los archivos de soporte)
  3. Inicie Word y abra la htmfile salvado (Word se abrirá correctamente)
  4. realizar las modificaciones si es necesario
  5. Seleccione Guardar como y seleccione la extensión que le gustaría doc, docx, etc.
+0

Creo que esta respuesta es mejor que el cambio de nombre, pero soy yo :) – yossico

+0

Si quieres una verdadera conversión puedes probar una API de HTML a DOCX como esta: https://grabz.it/html-to-word-docx-api.aspx – user1474090

24

Intente utilizar pandoc

pandoc -f html -t docx -o output.docx input.html 

la entrada o del formato de salida no se especifica explícitamente, Pandoc intentará adivinar a partir de las extensiones de los nombres de archivo de entrada y salida.
- Manual Pandoc

Así que incluso se puede utilizar

pandoc -o output.docx input.html 
+0

Esto funciona muy bien. Tan fácil como sudo apt-get install -y pandoc (en Ubuntu) – Alejo

+0

Estoy de acuerdo en que esta es realmente una buena solución si buscas algo más de lo que ofrece MS Word, sino que también te brinda una herramienta de uso general para usar en otros lugares (por ejemplo, conversión de HTML a PDF, etc.). Al decir que para una opción realmente básica, la sugerencia de que d4nt sugiera también funciona como un placer :) –

+0

esto no funciona en mi caso – Beraliv

5

poco más allá de esto en la cabeza de su página php. antes de cualquier código en esto debería ser el código superior.

<?php 
header("Content-Type: application/vnd.ms-word"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("content-disposition: attachment;filename=Hawala.doc"); 

?> 

Esto convertirá todos los html en MSWORD, ahora se puede personalizar de acuerdo a sus requerimientos del cliente.

+1

Esto es mejor si usa php – mintedsky

+1

Sin embargo, no se limita a PHP. Word se complace en abrir contenido HTML en un archivo doc pero no en un archivo docx. Ojalá hubiera sabido esto antes de pasar tiempo intentando convertirlo de varias maneras. –