Puede utilizar Docotic.Pdf library para buscar texto en archivos PDF.
siguiente ejemplo muestra cómo encontrar cadenas especificadas en un archivo PDF y números de páginas correspondientes:
static void searchForTextStrings()
{
string path = "";
string[] stringsToFind = new string[] { };
using (PdfDocument pdf = new PdfDocument(path))
{
for (int i = 0; i < pdf.Pages.Count; i++)
{
string pageText = pdf.Pages[i].GetText();
foreach (string s in stringsToFind)
{
int index = pageText.IndexOf(s, 0, StringComparison.CurrentCultureIgnoreCase);
if (index != -1)
Console.WriteLine("'{0}' found on page {1}", s, i);
}
}
}
}
Una búsqueda entre mayúsculas y minúsculas pueden llevarse a cabo si se quita tercer argumento del método IndexOf.
Descargo de responsabilidad: Trabajo para Bit Miracle, proveedor de la biblioteca.
¡Gracias por el código! Sin embargo, esta muestra necesita una instalación de Adobe Professional. Por razones de licencia de regalías, me gustaría tener un componente para hacer esto. – splattne