PDF -> text

Michal Krause michal na krause.cz
Pátek Listopad 15 15:35:36 CET 2002


On 15/11/2002, Petr Zapadlo wrote:

> mam nekolik pdf co je u nich zakazano vykopirovat text a me by se to
> docela hodilo.
> 
> Zkousel jsem pdf2ps -> ps2ascii ale z toho bic nevypadne (prazdny soubor)
> 
> Dale jsem zkousel balik xpdf, resp. pdftotext, ale ten zarval ze
> nejsou patricna prava vykopirovat text. nasel jsem si na netu patch
> pro xpdf , ten sice zafungoval, jakysi text to vyplyvlo ale neni to
> citelne.
> 
> Sklada se to pouze z velkych pismen a originalu to neodpovida ani
> nahodou.
> 
> Pouze sem tam se objevi citelna veta.
> 
> Je nejaka cesta jak dostat text z takoveho pdf?

Zrovna nedavno jsem nekde cetl takovy docela trefny nazor. Kdosi (jemuz
se omlouvam za volnou citaci bez uvedeni zdroje, bohuzel uz ale nevim,
kde a kdo to byl) napsal cosi ve smyslu, ze Adobe dobre vi, proc se
jejich nastroj na vytvareni PDF jmenuje Distiller - ze slivovice totiz
take svestku zpatky nedostanete. Trebas to po svestce voni a mozna
i chutna, svestka uz to neni.

Jednak me to docela pobavilo (Vas predpokladam uz mene) a jednak je to
myslim celkem trefny popis situace :))

S pozdravem
-- 
Michal Krause                                                       /\
                        Informace (nejenom) ze sveta Linuxu      /\/  \
email: michal na krause.cz _______ http://www.root.cz/ _______ NAVRCHOLU.cz

Vsetci by chceli byt van Goghmi, ale odrezat si ucho ani jeden.
                                                  J. Raz ve filmu Rabaka


Další informace o konferenci Linux