2010-12-08 24 views
6

me gustaría lograr lo siguiente:convierte un archivo HTML al archivo PDF utilizando iTextSharp

Dado el nombre de ruta de un archivo html, y la ruta deseada de un archivo PDF, convertir el archivo HTML a PDF utilizando iTextSharp . He visto muchas muestras de código que se acercan a esto pero no exactamente lo que necesito. Creo que mi solución necesitará usar la función iTextSharp.text.html.simpleparser.HTMLWorker.ParseToList(), pero tengo problemas para hacer que esto funcione con un archivo HTML real y generar un archivo PDF real.

public void GeneratePDF(string htmlFileName, string outputPDFFileName) 
{...} 

es la función que realmente me gustaría que funcione correctamente.

Gracias de antemano

Editar: He aquí un ejemplo que he de lo que he intentado:

iTextSharp.text.Document doc = new Document(); 
     PdfWriter.GetInstance(doc, new FileStream(Path.GetFullPath("fromHTML.pdf"), FileMode.Create)); 

     doc.Open(); 

     try 
     { 
      List<IElement> list = iTextSharp.text.html.simpleparser.HTMLWorker.ParseToList(new StringReader(File.ReadAllText(this.textBox1.Text)), null); 
      foreach (IElement elm in list) 
      { 
       doc.Add(elm); 
      } 
     } 
     catch (Exception ex) 
     { 
      MessageBox.Show(ex.Message); 
     } 

     doc.Close(); 

Tenga en cuenta que TextBox1.Text contiene el nombre de la ruta completa del archivo html I Estoy tratando de convertir a PDF y quiero que esto salga como "desde HTML.pdf"

¡Gracias!

+0

¿Puedes publicar algún código de tu intento? – Simon

+3

[repita la repetición de la pregunta repetida] (http://stackoverflow.com/search?q=itextsharp+convert+html) –

Respuesta

2

Tuve el mismo requisito y fui desviado a esta página por Google pero no pude encontrar una respuesta concreta. Pero después de algunos golpes y pruebas, he podido convertir con éxito el código HTML a PDF utilizando la biblioteca iTextSharp 5.1.1. El código que he compartido aquí también se ocupa de las etiquetas img en HTML con rutas relativas. La biblioteca iTextSharp arroja un error si sus etiquetas img no tienen src absoluto. Encontrará el código aquí: http://am22tech.com/s/22/Blogs/post/2011/09/28/HTML-To-PDF-using-iTextSharp.aspx

Deseo saber si necesita más información. El código está en C#.

Cuestiones relacionadas