PDF -> text

Michal Krause michal na krause.cz
Pátek Listopad 15 17:32:41 CET 2002


On 15/11/2002, Tomáš Vondra wrote:

> MK> Zrovna nedavno jsem nekde cetl takovy docela trefny nazor. Kdosi (jemuz
> MK> se omlouvam za volnou citaci bez uvedeni zdroje, bohuzel uz ale nevim,
> MK> kde a kdo to byl) napsal cosi ve smyslu, ze Adobe dobre vi, proc se
> MK> jejich nastroj na vytvareni PDF jmenuje Distiller - ze slivovice totiz
> MK> take svestku zpatky nedostanete. Trebas to po svestce voni a mozna
> MK> i chutna, svestka uz to neni.
> 
> Obavam se ze tohle neni uplne ten pripad. V obycejnem PDF se totiz
> jedna ciste o kodovani, a ten text z toho skutecne lze bez problemu
> dostat (pominme problemy z formatovanim, napriklad v nekolika
> sloupcich).

Ja osobne jsem to tedy mnohokrat nezkousel, ale vetsina pokusu dostat
z PDF cesky text, ktere jsem absolvoval, dopadla dost mizerne. Pravda
je, ze puvodni tazatel jazyk myslim nezminoval, takze pokud je to
anglictina, mohlo by to u normalniho PDF jit. Ochrana to samozrejme
jeste komplikuje.

S pozdravem
-- 
Michal Krause                                                       /\
                        Informace (nejenom) ze sveta Linuxu      /\/  \
email: michal na krause.cz _______ http://www.root.cz/ _______ NAVRCHOLU.cz

Vsetci by chceli byt van Goghmi, ale odrezat si ucho ani jeden.
                                                  J. Raz ve filmu Rabaka


Další informace o konferenci Linux