Todo depende de cómo se han incluido los datos dentro del PDF. En términos generales, hay dos escenarios posibles aquí:
Los datos son solo un objeto de texto dentro de un PDF. Tendrá que usar una herramienta para extraer el texto del PDF y luego insertarlo en su base de datos.
Los datos están contenidos dentro de los campos de formulario en un archivo PDF. Tendrá que usar una herramienta para extraer datos de los campos del formulario e insertarlos en su base de datos.
Esperemos que el escenario n. ° 2 se aplique a usted, porque esto es precisamente para lo que están diseñados los formularios PDF. El escenario n. ° 1 es solo un truco que solo usarías si no tuvieras otras opciones. Extraer texto sin formato de un PDF no es tan fácil o preciso como cabría esperar.
Si recibe un formulario PDF a continuación, todo lo que necesita hacer es comparar los campos adecuados en el formulario PDF con los campos correspondientes en su base de datos y luego chupar en los datos. Este proceso podría ser completamente automatizado si usted escribió su propia aplicación.
¿Esto requiere escribir una aplicación o ¿hay una forma automatizada de hacer esto?
Sí, estas dos opciones requerirían escribir una aplicación o comprar una aplicación. Si escribe su propia aplicación, necesitará encontrar una biblioteca PDF de terceros que admita la recuperación de datos de los campos del formulario o la extracción de texto de un PDF.
Sin respuesta precisa aquí, Fermín, sacaste las herramientas para extraer? – CallMeLaNN
@CallMeLaNN - Mi empresa llegó a un acuerdo con la tercera parte que suministra los datos así que al final no estaba obligado a escribir cualquier cosa para hacer esto. – Fermin