FORUM D’ENTRAIDE INFORMATIQUE (FEI)
Site d’assistance et de sécurité informatique

Entraide sur les logiciels et les pilotes.
Règles du forum : Entraide sur les logiciels et les pilotes (drivers) : logiciel qui ne fonctionne pas ou mal, recherche de logiciel, problème ou recherche de pilote... Pour tous les systèmes d'exploitation.
Merci de préciser votre système d'exploitation ainsi que d'autres informations utiles si nécessaire.
Merci également de lire et de respecter la charte générale du forum.
  • Avatar du membre
  • Avatar du membre
Avatar du membre
par nairolf
#154270
Bonjour,

J'ai recuperé des documents via pdf.
Je souhaite ressortir les textes sur celui ci.

Pour ce faire , je sélectionne tous simplement mes textes et je les copie colle sur mon Notepad+++
Sur 99% des pdf cette methode fonctionne , mais pour 1 d'entre eux j'ai un gros souci.
Une fois collé le texte désiré j'obtient de l'interlettrage !!!

voila la forme du resultat : l e s t e x t e s s o n t s é p a r é s !
Tout mon texte est séparé par un expace entre lettre , MAIS les espaces entre mots est quand à lui resté à l'identique.

Pour resumé j'ai 1 espace partout sur mon document.
J'ai pensé dans un premier temps supprimer tout les Espaces sur Notepad+++ mais au résultats j'obtient un pavé monobloc et je dois reséparé tous les mots , bref infaisable.
Sachant que j'ai 92 pages de pdf à recup ....
Quelqu'un à une solution miracle svp ?
Avatar du membre
par roidesgobs
#154300
merci de ta reponse mais ce n'est pas celle que j'attendais.

J'arrive bien a recup les 92 pages de textes sans difficultés mais le probleme est qu'il y a un espace entre chaque lettre.
Voila un aperçu ce sera sans doute plus clair :


A s c h a r a c t e r s a p p r o a c h G r e e n e s t , th e y s e e th a t a b lu e
d r a g o n a n d its C u lt o f th e D r a g o n a l l ie s a r e a t t a c k in g
th e t ow n . T h e c u l t is t s s e e k to c o l l e c t t r e a s u r e th a t th e y
h o p e to p r e s e n t t o T iam a t u p o n h e r a r r iv a l in th e w o r ld .
T h e cu lt h a s a s s em b le d a p ow e r fu l f o r c e f o r th is r a id b y
g a th e r in g b a n d i t s , k o b o ld s , s e l lsw o r d s , a n d o th e r m e r c
e n a r y t y p e s in t o a sm a l l a rm y . A m o n k n am e d L e o s in
E r la n th a r w a s a ls o in t ow n . T h r o u g h d i l ig e n t r e s e a r c h
a n d in t e r v iew s c o n d u c t e d d u r in g h is t r a v e ls b e tw e e n
B e r d u s k a n d C a n d le k e e p , L e o s in b e c a m e c o n v in c e d
th a t th e c u l t is e n g a g e d in a b ig o p e r a t io n , b u t h e d o e s n 't
y e t k n o w w h a t it is . L e o s in u s e s th e r a id a s a n o p p o r t u n
it y t o in f i lt r a te th e c u l t s o th a t h e c a n le a r n m o r e a b o u t
th e c u l t 's p la n s . H e is d is c o v e r e d a n d c a p tu r e d , h ow e v e r ,
a n d n e e d s th e c h a r a c t e r s ' h e lp to e s c a p e f r om ca p t iv ity .
C h a r a c t e r s c a n e n g a g e in s e v e r a l e n c o u n t e r s w h i le
c u l t is t s a n d k o b o ld s r am p a g e t h r o u g h G r e e n e s t .


Bref c'est illisible il faut que je supprime manuellement tout les espaces.
Sur 94 pages A4 il me faudra plusieurs jours.
Avatar du membre
par jca
#154301
Bonjour

as tu essayé avec la méthode du tuto pour extraire le texte du pdf ?

sinon en passant par un ocr
Avatar du membre
par jca
#154314
Bonsoir

Ben content d'avoir pu t'aider
Ce sujet sera peut être le dernier résolu en 2014

Bon réveillon

Merci pour la réponse ;) Pour verifier […]

Hello Ça me semble complexe, avez vous e[…]

hey Eh beh tu vas bien te faire balader par tes co[…]