Pdf na palmu

OldFrog oldfrog na volny.cz
Středa Září 25 20:59:22 CEST 2002


>
>
>> a je zajimave, ze nektere ohackovane znaky ve vysledku jsou a jine ne.
>> Tak napriklad č je v souboru tam kde ma byt stejne jako ě ř ú ů, ale
>> treba š a ž nikde v dokumentu neni, proste se vynecha.
>
> a asi tam nebude ani t', vypada to ze problem bude v kodovani, nejak 
> se vam tam pripletlo windows-1250: s, z a t (a S, Z, T) je jedinych 
> sest znaku, ve kterych je rozdil ve windows-1250 x latin 2 (samozrejme 
> pokud bereme v uvahu pouze ceskou abacedu)


Pdftotext z zpdf neni spolehlivy nastroj na konverzi pdf do textu. Znam 
konkretni pripady, kdy selze.
Jde predevsim o puvod pdf a pouzite fonty. Osobne pouzivam prikaz

pdftotext -latin2 document.pdf document.txt

ktery bud funguje, nebo taky ne. Nejvice mne mrzi, ze selze nekdy i u 
pdf generovanych z pdfTeXu.
Podrobneji v archivu konference "csTeX na cs.felk.cvut.cz", ktery lze 
dohledat na"www.cstug.cz"
(nyni myslim mimo provoz), hledejte thread "PDF -> Text".

S pozdravem
OldFrog.






Další informace o konferenci Linux