vytahnout text z PDF
Jozef Martiniak
jozo na soueza.utc.sk
Pátek Říjen 15 16:30:34 CEST 2004
A skusili ste zmenit kodovanie textu v /usr/X11R6/etc/xpdfrc ?
je to parameter:
textEncoding Latin2
Dňa Piatok 15 Október 2004 09:32 Milos Prudek napísal:
>
> Potrebuju vytahnout text z PDF dokumentu, vcetne ceskych znaku, a vcetne
> rozlozeni tabulky.
>
> Napr. program pdftotext umi vytahnout text, ale nedodrzi rozlozeni
> tabulky ani ceske znaky.
>
> Kolega to udelal proste tak, ze PDF poslal do OCR programu ve Windows...
> vysledek byl dost chaoticky zformatovany Word dokument s pomichanymi
> sloupci v tabulce.
>
> Lze to udelat nejak lepe?
>
> --
> Milos Prudek
Další informace o konferenci Linux