Pdf na palmu
Josef Hajas
jhajas na centrum.cz
Středa Září 25 13:03:35 CEST 2002
Hezky den,
chtel bych se zeptat jake zkusenosti mate s konvertovanim pdf dokumentu
do textu (pak uz to treba pomoci meho oblibeneho pluckeru neni na palma
problem dostat). V mem debianu je pritomny pdftotext 1.0 (zkousel jsem i
kompilovat 1.01 se stejnym vysledkem) z balicku xpdf
a je zajimave, ze nektere ohackovane znaky ve vysledku jsou a jine ne.
Tak napriklad č je v souboru tam kde ma byt stejne jako ě ř ú ů, ale
treba š a ž nikde v dokumentu neni, proste se vynecha.
Zkousel jsem stahnout balicek s podporou latin2 a do /etc/xpdfrc pridal
radek
unicodeMap Latin2 /usr/share/xpdf/latin2/Latin2.unicodeMap
ale kdyz na radku specifikuji -enc Latin2 tak je vysledek jeste horsi.
Vedel by nekdo co s tim?
Diky
Josef Hajas
Další informace o konferenci Linux