Qualité de convertion pdf to html

Bug #952784 reported by isaric
6
This bug affects 1 person
Affects Status Importance Assigned to Milestone
Brigade francophone anti-bogues
Fix Released
Undecided
Unassigned

Bug Description

J'ai établi un rapport sur : https://bugs.freedesktop.org/show_bug.cgi?id=43297
Je ne sais pas trop si c'est le bon endroit...

Avec poppler-utils 0.16.7-2ubuntu2 (oneiric) et la commande "pdftohtml -c *.pdf"

Je souhaite par exemple convertir :
isaric.cof.free.fr/PDFtoHTML/5-1d-a-afk-1-15-18-55-62.pdf
cela donne
http://isaric.cof.free.fr/PDFtoHTML/5-1d-a-afk_ind.html
On remarque des erreurs de mise en page, comme le espaces dans les colonnes.

D'avance merci

Revision history for this message
Nicolas Delvaux (malizor) wrote :

Bonjour,

Tu as en effet rapporté le bug au bon endroit et ta description me parait suffisamment claire.
Du coup, il n'y a plus rien à faire au niveau de l'équipe francophone (c'est donc pour ça que je ferme ce rapport).

De façon moins formelle, je te dirais que ce genre d'outil de conversion n'a jamais été très fiable.
Le PDF que tu donnes en exemple est un document complexe. Même si le résultat de la conversion n'est pas parfait, ça me semble tout de même acceptable.
Selon ce que tu cherche à obtenir, il est possible de partir du html généré afin de le modifier. pdftohtml offre quelques options qui pourrait te faciliter la tache.

Si tu as besoin d'aide pour ce « post-processing », n'hésite pas à ouvrir un sujet sur le forum de ubuntu-fr.

Changed in bugsquad-fr:
status: New → Fix Released
Revision history for this message
isaric (isaric-co) wrote :
To post a comment you must log in.
This report contains Public information  
Everyone can see this information.

Other bug subscribers

Remote bug watches

Bug watches keep track of this bug in other bug trackers.