par jca » mer. 31 déc. 2014 19:08
Bonsoir
Ben content d'avoir pu t'aider
Ce sujet sera peut être le dernier résolu en 2014
Bon réveillon
Bonsoir
Ben content d'avoir pu t'aider
Ce sujet sera peut être le dernier résolu en 2014
Bon réveillon
par
2011N2 » mer. 31 déc. 2014 18:14
Bonjour,
Du coup, j'ai passé ton sujet en résolu sur CCM...
http://www.commentcamarche.net/forum/af ... erlettrage
Gabriel.
Bonjour,
Du coup, j'ai passé ton sujet en résolu sur CCM... :mv: http://www.commentcamarche.net/forum/affich-31295149-supprimer-l-interlettrage
Gabriel.
par roidesgobs » mer. 31 déc. 2014 17:33
Un grand merci a toi l'OCR a fonctionné XD
Joyeux reveillon
Un grand merci a toi l'OCR a fonctionné XD
Joyeux reveillon
par jca » mer. 31 déc. 2014 15:44
re
par exemple
http://france.abbyy.com/finereader/francais/
par jca » mer. 31 déc. 2014 15:40
Bonjour
as tu essayé avec la méthode du tuto pour extraire le texte du pdf ?
sinon en passant par un ocr
Bonjour
as tu essayé avec la méthode du tuto pour extraire le texte du pdf ?
sinon en passant par un ocr
par roidesgobs » mer. 31 déc. 2014 15:38
merci de ta reponse mais ce n'est pas celle que j'attendais.
J'arrive bien a recup les 92 pages de textes sans difficultés mais le probleme est qu'il y a un espace entre chaque lettre.
Voila un aperçu ce sera sans doute plus clair :
A s c h a r a c t e r s a p p r o a c h G r e e n e s t , th e y s e e th a t a b lu e
d r a g o n a n d its C u lt o f th e D r a g o n a l l ie s a r e a t t a c k in g
th e t ow n . T h e c u l t is t s s e e k to c o l l e c t t r e a s u r e th a t th e y
h o p e to p r e s e n t t o T iam a t u p o n h e r a r r iv a l in th e w o r ld .
T h e cu lt h a s a s s em b le d a p ow e r fu l f o r c e f o r th is r a id b y
g a th e r in g b a n d i t s , k o b o ld s , s e l lsw o r d s , a n d o th e r m e r c
e n a r y t y p e s in t o a sm a l l a rm y . A m o n k n am e d L e o s in
E r la n th a r w a s a ls o in t ow n . T h r o u g h d i l ig e n t r e s e a r c h
a n d in t e r v iew s c o n d u c t e d d u r in g h is t r a v e ls b e tw e e n
B e r d u s k a n d C a n d le k e e p , L e o s in b e c a m e c o n v in c e d
th a t th e c u l t is e n g a g e d in a b ig o p e r a t io n , b u t h e d o e s n 't
y e t k n o w w h a t it is . L e o s in u s e s th e r a id a s a n o p p o r t u n
it y t o in f i lt r a te th e c u l t s o th a t h e c a n le a r n m o r e a b o u t
th e c u l t 's p la n s . H e is d is c o v e r e d a n d c a p tu r e d , h ow e v e r ,
a n d n e e d s th e c h a r a c t e r s ' h e lp to e s c a p e f r om ca p t iv ity .
C h a r a c t e r s c a n e n g a g e in s e v e r a l e n c o u n t e r s w h i le
c u l t is t s a n d k o b o ld s r am p a g e t h r o u g h G r e e n e s t .
Bref c'est illisible il faut que je supprime manuellement tout les espaces.
Sur 94 pages A4 il me faudra plusieurs jours.
merci de ta reponse mais ce n'est pas celle que j'attendais.
J'arrive bien a recup les 92 pages de textes sans difficultés mais le probleme est qu'il y a un espace entre chaque lettre.
Voila un aperçu ce sera sans doute plus clair :
A s c h a r a c t e r s a p p r o a c h G r e e n e s t , th e y s e e th a t a b lu e
d r a g o n a n d its C u lt o f th e D r a g o n a l l ie s a r e a t t a c k in g
th e t ow n . T h e c u l t is t s s e e k to c o l l e c t t r e a s u r e th a t th e y
h o p e to p r e s e n t t o T iam a t u p o n h e r a r r iv a l in th e w o r ld .
T h e cu lt h a s a s s em b le d a p ow e r fu l f o r c e f o r th is r a id b y
g a th e r in g b a n d i t s , k o b o ld s , s e l lsw o r d s , a n d o th e r m e r c
e n a r y t y p e s in t o a sm a l l a rm y . A m o n k n am e d L e o s in
E r la n th a r w a s a ls o in t ow n . T h r o u g h d i l ig e n t r e s e a r c h
a n d in t e r v iew s c o n d u c t e d d u r in g h is t r a v e ls b e tw e e n
B e r d u s k a n d C a n d le k e e p , L e o s in b e c a m e c o n v in c e d
th a t th e c u l t is e n g a g e d in a b ig o p e r a t io n , b u t h e d o e s n 't
y e t k n o w w h a t it is . L e o s in u s e s th e r a id a s a n o p p o r t u n
it y t o in f i lt r a te th e c u l t s o th a t h e c a n le a r n m o r e a b o u t
th e c u l t 's p la n s . H e is d is c o v e r e d a n d c a p tu r e d , h ow e v e r ,
a n d n e e d s th e c h a r a c t e r s ' h e lp to e s c a p e f r om ca p t iv ity .
C h a r a c t e r s c a n e n g a g e in s e v e r a l e n c o u n t e r s w h i le
c u l t is t s a n d k o b o ld s r am p a g e t h r o u g h G r e e n e s t .
Bref c'est illisible il faut que je supprime manuellement tout les espaces.
Sur 94 pages A4 il me faudra plusieurs jours.
par jca » mer. 31 déc. 2014 13:04
Bonjour
Petit tuto qui pourrait t'aider
http://forums.cnetfrance.fr/topic/1228887-comment-extraire-du-texte-d-un-fichier-pdf/
par JCA » mer. 31 déc. 2014 13:02
Bonjour
Petit tuto qui peut t'aider
http://forums.cnetfrance.fr/topic/1228887-comment-extraire-du-texte-d-un-fichier-pdf/
par nairolf » mer. 31 déc. 2014 09:16
Bonjour,
J'ai recuperé des documents via pdf.
Je souhaite ressortir les textes sur celui ci.
Pour ce faire , je sélectionne tous simplement mes textes et je les copie colle sur mon Notepad+++
Sur 99% des pdf cette methode fonctionne , mais pour 1 d'entre eux j'ai un gros souci.
Une fois collé le texte désiré j'obtient de l'interlettrage !!!
voila la forme du resultat : l e s t e x t e s s o n t s é p a r é s !
Tout mon texte est séparé par un expace entre lettre , MAIS les espaces entre mots est quand à lui resté à l'identique.
Pour resumé j'ai 1 espace partout sur mon document.
J'ai pensé dans un premier temps supprimer tout les Espaces sur Notepad+++ mais au résultats j'obtient un pavé monobloc et je dois reséparé tous les mots , bref infaisable.
Sachant que j'ai 92 pages de pdf à recup ....
Quelqu'un à une solution miracle svp ?
Bonjour,
J'ai recuperé des documents via pdf.
Je souhaite ressortir les textes sur celui ci.
Pour ce faire , je sélectionne tous simplement mes textes et je les copie colle sur mon Notepad+++
Sur 99% des pdf cette methode fonctionne , mais pour 1 d'entre eux j'ai un gros souci.
Une fois collé le texte désiré j'obtient de l'interlettrage !!!
voila la forme du resultat : l e s t e x t e s s o n t s é p a r é s !
Tout mon texte est séparé par un expace entre lettre , MAIS les espaces entre mots est quand à lui resté à l'identique.
Pour resumé j'ai 1 espace partout sur mon document.
J'ai pensé dans un premier temps supprimer tout les Espaces sur Notepad+++ mais au résultats j'obtient un pavé monobloc et je dois reséparé tous les mots , bref infaisable.
Sachant que j'ai 92 pages de pdf à recup ....
Quelqu'un à une solution miracle svp ?