vytahnout text z PDF

Jozef Martiniak jozo na soueza.utc.sk
Pátek Říjen 15 16:30:34 CEST 2004


A skusili ste zmenit kodovanie textu v /usr/X11R6/etc/xpdfrc ?

je to parameter:
textEncoding            Latin2

Dňa Piatok 15 Október 2004 09:32 Milos Prudek napísal:
> 
> Potrebuju vytahnout text z PDF dokumentu, vcetne ceskych znaku, a vcetne 
> rozlozeni tabulky.
> 
> Napr. program pdftotext umi vytahnout text, ale nedodrzi rozlozeni 
> tabulky ani ceske znaky.
> 
> Kolega to udelal proste tak, ze PDF poslal do OCR programu ve Windows... 
> vysledek byl dost chaoticky zformatovany Word dokument s pomichanymi 
> sloupci v tabulce.
> 
> Lze to udelat nejak lepe?
> 
> -- 
> Milos Prudek


Další informace o konferenci Linux