vytahnout text z PDF

Kateřina Bubeníčková katerina.bubenickova na plbohnice.cz
Pátek Říjen 15 14:37:29 CEST 2004


Zkuste parametry -raw -enc latin2,
viz man pdftotext

Milos Prudek napsal(a):

>Potrebuju vytahnout text z PDF dokumentu, vcetne ceskych znaku, a vcetne 
>rozlozeni tabulky.
>
>Napr. program pdftotext umi vytahnout text, ale nedodrzi rozlozeni 
>tabulky ani ceske znaky.
>
>Kolega to udelal proste tak, ze PDF poslal do OCR programu ve Windows... 
>vysledek byl dost chaoticky zformatovany Word dokument s pomichanymi 
>sloupci v tabulce.
>
>Lze to udelat nejak lepe?
>
>  
>



Další informace o konferenci Linux