FORUM D’ENTRAIDE INFORMATIQUE (FEI)
Site d’assistance et de sécurité informatique

Automatiser l'extraction de données PDF?

Règles du forum : Entraide concernant la programmation informatique en général, tous langages : recherche ou correction d'un code ou d'une fonction, aide à la réalisation d'un projet...
Pour la programmation web (HTML, CSS, PHP, MySQL...), il est conseillé de s'orienter dans le forum Webmastering.
Merci de lire et de respecter la charte générale du forum.

Répondre

Afin d’empêcher la création automatisée de comptes, nous vous demandons de réussir le défi ci-contre.
Smileys
:D :) :-) ;) :| :( :cry: :cheers: :hourra: :mv: :lol: :mdr: :bonjour: :hello: :jap: :siffle: :bisou: :P :o :x :roll: :good: :bad: :super: :reflexion: :suspect: :? :oops: :peur: :zen: :boude: :bug:

Revue du sujet : Automatiser l'extraction de données PDF? Étendre la vue

Automatiser l'extraction de données PDF?

par giselegadot3 » jeu. 8 oct. 2020 09:34
Une chose que je fais dans le cadre de mon travail est de prendre des informations sur les clients des formulaires PDF qu'ils ont remplis et de les saisir dans une base de données distincte. Malheureusement, je doute que je puisse utiliser une API ou une autre méthode pour interfacer directement avec les tables de la base de données car elle est hors de mon contrôle et une application relativement petite, mais j'ai remarqué que je peux naviguer dans les formulaires que je dois remplir assez facilement avec la touche "tab".

La nature de ces PDF est étrange en ce que la disponibilité de certaines informations et les mises en page ne sont pas constantes. Cependant, une constante commune est la possibilité de "contrôler + F" et de rechercher le nom des informations que vous souhaitez, ex. "Age" et indiquez la valeur de l'âge disponible juste à côté. Si la recherche de page ne renvoie aucun résultat, ces informations ne sont pas disponibles.
10.0.0.0.1 192.168.1.254
s nécessaires à partir du PDF. Ensuite, il doit compiler ces informations dans une macro qui parcourt toute la page et entre automatiquement toutes les valeurs extraites du PDF. D'après l'expérience, j'ai entendu dire que python pouvait être bon pour cela, mais je suis ouvert à tout. Où est-ce que je commence? De quelles API et bibliothèques ai-je besoin pour faire cela? Des tutoriels disponibles en ligne? Comme vous pouvez le constater, je ne suis pas trop familier avec ceci :(

Re Bonsoir, J'ai essayé la solution avec AO[…]

New crash game Plinko

För mig handlar det om att ha tillgång […]

Bug PC

Re je n' ai plus accés à vos donn&e[…]

Exploring online casinos in Hungary has been an ex[…]