vytahnout text z PDF

Milos Prudek prudek na bvx.cz
Pátek Říjen 15 09:32:45 CEST 2004


Potrebuju vytahnout text z PDF dokumentu, vcetne ceskych znaku, a vcetne 
rozlozeni tabulky.

Napr. program pdftotext umi vytahnout text, ale nedodrzi rozlozeni 
tabulky ani ceske znaky.

Kolega to udelal proste tak, ze PDF poslal do OCR programu ve Windows... 
vysledek byl dost chaoticky zformatovany Word dokument s pomichanymi 
sloupci v tabulce.

Lze to udelat nejak lepe?

-- 
Milos Prudek
_________________
Most websites are
confused chintzy gaudy conflicting tacky unpleasant... unusable.
Learn how usable YOUR website is! http://www.spoxdesign.com


Další informace o konferenci Linux