Qualité de convertion pdf to html
Bug #952784 reported by
isaric
This bug affects 1 person
Affects | Status | Importance | Assigned to | Milestone | |
---|---|---|---|---|---|
Brigade francophone anti-bogues |
Fix Released
|
Undecided
|
Unassigned |
Bug Description
J'ai établi un rapport sur : https:/
Je ne sais pas trop si c'est le bon endroit...
Avec poppler-utils 0.16.7-2ubuntu2 (oneiric) et la commande "pdftohtml -c *.pdf"
Je souhaite par exemple convertir :
isaric.
cela donne
http://
On remarque des erreurs de mise en page, comme le espaces dans les colonnes.
D'avance merci
To post a comment you must log in.
Bonjour,
Tu as en effet rapporté le bug au bon endroit et ta description me parait suffisamment claire.
Du coup, il n'y a plus rien à faire au niveau de l'équipe francophone (c'est donc pour ça que je ferme ce rapport).
De façon moins formelle, je te dirais que ce genre d'outil de conversion n'a jamais été très fiable.
Le PDF que tu donnes en exemple est un document complexe. Même si le résultat de la conversion n'est pas parfait, ça me semble tout de même acceptable.
Selon ce que tu cherche à obtenir, il est possible de partir du html généré afin de le modifier. pdftohtml offre quelques options qui pourrait te faciliter la tache.
Si tu as besoin d'aide pour ce « post-processing », n'hésite pas à ouvrir un sujet sur le forum de ubuntu-fr.