vytahnout text z PDF
Kateřina Bubeníčková
katerina.bubenickova na plbohnice.cz
Pátek Říjen 15 14:37:29 CEST 2004
Zkuste parametry -raw -enc latin2,
viz man pdftotext
Milos Prudek napsal(a):
>Potrebuju vytahnout text z PDF dokumentu, vcetne ceskych znaku, a vcetne
>rozlozeni tabulky.
>
>Napr. program pdftotext umi vytahnout text, ale nedodrzi rozlozeni
>tabulky ani ceske znaky.
>
>Kolega to udelal proste tak, ze PDF poslal do OCR programu ve Windows...
>vysledek byl dost chaoticky zformatovany Word dokument s pomichanymi
>sloupci v tabulce.
>
>Lze to udelat nejak lepe?
>
>
>
Další informace o konferenci Linux