No puedo detectar la página en blanco en el archivo pdf. He buscado en Internet pero no he encontrado una buena solución.Cómo encontrar la página en blanco en el archivo pdf
Uso de Itextsharp Probé con el tamaño de página, Xobjects. Pero no dan el resultado exacto .
me trataron
if(xobjects==null || textcontent==null || size <20 bytes)
then "blank"
else
not blank
Pero el tiempo máximo que devuelve respuesta incorrecta. He utilizado iTextSharp
El código está por debajo ... estoy usando iTextSharp Librabry
Para XObjects
PdfDictionary xobjects = resourceDic.GetAsDict(PdfName.XOBJECT);
//here resourceDic is PdfDictionary type
//I know that if Xobjects is null then page is blank. But sometimes blank page gives xobjects which is not null.
Para contentstream
RandomAccessFileOrArray f = reader.SafeFile;
//here reader = new PdfReader(filename);
byte[] contentBytes = reader.GetPageContent(pageNum, f);
//I have measured the size of contentbytes but sometimes it gives more than 20 bytes for blank page
Para TextContent
String extractedText = PdfTextExtractor.GetTextFromPage(reader, pageNum, new LocationTextExtractionStrategy());
// sometimes blank page give a text more than 20 char length .
¿Qué _haces_ en una página que sabes que está en blanco? (Edite este detalle en su respuesta, en lugar de agregar detalles sustanciales en los comentarios). – halfer
@halfer ver ahora. –
Esa es una buena pregunta ahora. No sé la respuesta, ya que no he hecho ningún análisis de PDF antes. ¿Ha analizado esas tres categorías de objetos para ver si las páginas vacías tienen algo en común? Por ejemplo, ¿qué contenido de texto aparece realmente en una página en blanco? – halfer