PDF -> text
Michal Krause
michal na krause.cz
Pátek Listopad 15 15:35:36 CET 2002
On 15/11/2002, Petr Zapadlo wrote:
> mam nekolik pdf co je u nich zakazano vykopirovat text a me by se to
> docela hodilo.
>
> Zkousel jsem pdf2ps -> ps2ascii ale z toho bic nevypadne (prazdny soubor)
>
> Dale jsem zkousel balik xpdf, resp. pdftotext, ale ten zarval ze
> nejsou patricna prava vykopirovat text. nasel jsem si na netu patch
> pro xpdf , ten sice zafungoval, jakysi text to vyplyvlo ale neni to
> citelne.
>
> Sklada se to pouze z velkych pismen a originalu to neodpovida ani
> nahodou.
>
> Pouze sem tam se objevi citelna veta.
>
> Je nejaka cesta jak dostat text z takoveho pdf?
Zrovna nedavno jsem nekde cetl takovy docela trefny nazor. Kdosi (jemuz
se omlouvam za volnou citaci bez uvedeni zdroje, bohuzel uz ale nevim,
kde a kdo to byl) napsal cosi ve smyslu, ze Adobe dobre vi, proc se
jejich nastroj na vytvareni PDF jmenuje Distiller - ze slivovice totiz
take svestku zpatky nedostanete. Trebas to po svestce voni a mozna
i chutna, svestka uz to neni.
Jednak me to docela pobavilo (Vas predpokladam uz mene) a jednak je to
myslim celkem trefny popis situace :))
S pozdravem
--
Michal Krause /\
Informace (nejenom) ze sveta Linuxu /\/ \
email: michal na krause.cz _______ http://www.root.cz/ _______ NAVRCHOLU.cz
Vsetci by chceli byt van Goghmi, ale odrezat si ucho ani jeden.
J. Raz ve filmu Rabaka
Další informace o konferenci Linux