Pdf na palmu

Josef Hajas jhajas na centrum.cz
Středa Září 25 13:03:35 CEST 2002


Hezky den,
chtel bych se zeptat jake zkusenosti mate s konvertovanim pdf dokumentu
do textu (pak uz to treba pomoci meho oblibeneho pluckeru neni na palma
problem dostat). V mem debianu je pritomny pdftotext 1.0 (zkousel jsem i 
kompilovat 1.01 se stejnym vysledkem) z balicku xpdf
a je zajimave, ze nektere ohackovane znaky ve vysledku jsou a jine ne.
Tak napriklad č je v souboru tam kde ma byt stejne jako ě ř ú ů, ale
treba š a ž nikde v dokumentu neni, proste se vynecha.

Zkousel jsem stahnout balicek s podporou latin2 a do /etc/xpdfrc pridal
radek
unicodeMap      Latin2          /usr/share/xpdf/latin2/Latin2.unicodeMap
ale kdyz na radku specifikuji -enc Latin2 tak je vysledek jeste horsi.

Vedel by nekdo co s tim?

Diky

Josef Hajas



Další informace o konferenci Linux