2010-07-07 37 views
39

He buscado en Google (sin suerte) para open source software that can convert doc, ppt, and pdf to HTML5. (Exactamente lo que Scribd) ¿Hay fuentes abiertas equivalentes al tipo de conversión que hace Scribd?Convertir pdf, doc, ppt a html5

Si alguien sabe de un servicio pago, eso también funcionaría. Scribd tiene un API, pero eso es para usar con el visor de flash. Además, me gustaría que aloje mi propio contenido, ya que necesito más control sobre el documento convertido html.

+0

¡Hola! ¿Alguna suerte con esto? –

Respuesta

1

http://wvware.sourceforge.net/

wvHtml: convertir el documento de Word en HTML4.0.

Posiblemente: http://www.abisource.com/ pero en este caso se ve como "documento abierto"> "html exportación" manualmente, tal vez plugins ayuda. No estoy seguro, ¿qué quiere decir con "software fuente que puede convertir".

O esto: http://www.zope.org/Members/sf/NuxDocument

También el pdftohtml le dará una página html output.But tendrá que trabajar a partir de su gráfica interface.Since que no parece ser muy interactivo.

15

Es poco probable que encuentre una sola oferta que haga todo esto, especialmente en el mundo del código abierto. Es más probable que termine confiando en una mezcolanza de cosas, e incluso puede necesitar encadenar algunos convertidores para llegar a HTML. (Por ejemplo, PDF -> ps -> HTML)

OpenOffice admite la conversión a HTML, y se puede llamar desde la línea de comandos.

http://pdftohtml.sourceforge.net/ parece bastante bueno en la conversión de PDF a html.

Para el documento que es formato Word ML o OpenXML es concebible que pueda usar transformaciones XSLT ya que ambos formatos de entrada y salida son XML. He visto algunas hojas de estilo flotando alrededor de la red que hacen esto, pero YMMV.

Por cierto, ¿por qué hay un requisito específico para el código abierto? MS Powerpoint ya admite guardar como HTML, por ejemplo.

+1

+1 para OpenOffice – vladr

+0

la versión anterior de PowerPoint utilizada para exportar una serie de imágenes para contenido como pdfs a html. Esto puede haber cambiado ya que no lo he probado por un tiempo. –

+0

Pdftohtml simplemente proporciona una salida de página html única, pero las apariencias no son muy agradables. Dado que la salida compleja proporciona buenos resultados html, crea un documento html por cada página en pdf. Puede que no sea factible para la gran cantidad de archivos pdf. – Daenarys

5

Open Office convertirá pdf a html pero tendrá éxito en la calidad del diseño.

Sugiero ya sea: Crocodoc como un servicio de pago (Proporciona diferentes sabores para diferentes plataformas como Python, Ruby, Java, PHP Los desarrolladores se les permite trabajar en sus APIs.) O en espera de una herramienta oficial de Adobe (está en proceso).

+3

Crocodoc es gratis ahora :) – Viral

+0

gracias por la actualización –

-1

Sé que la pregunta es poco viejo sin embargo he encontrado una nueva herramienta de código abierto llamado flaxpaper http://flexpaper.devaldi.com/

+0

bien, era de código abierto ahora cobran por el servicio. las cosas cambiaron a lo largo de los años –