Konverze PostScriptu (PDF) do TXT

Pavel Hofman pavel.hofman na insite.cz
Středa Červenec 12 11:20:34 CEST 2000


Dobry den,

Moje otazka se netyka 100% primo Linuxu, ale mezi Linuxovymi specialisty
je rada odborniku na PostScript.

Konverze postscriptu (prip. pdf) vytvoreneho z TeXu do txt neni velky
problem (vcetne cestiny). Potrebuji vsak v Linuxu zkonvertovat vetsi
mnozstvi PDF
souboru vyrobenych klasickym postupem ve Windows - tisk z Wordu 97 do PS
a pote konverze do PDF pomoci Acrobat Distilleru. 

Problem je, ze jiz z postscriptoveho souboru nelze text rozumne
vytahnout (tisk pres originalni MS drivery (Apple LaserWriter, HP
LaserJet 4M/PS) i pres Adobe PS driver) - ceske znaky zpusobuji, ze na
vystupu pstotext, ps2ascii jsou naproste nesmysly. Vzdy cast radky je
OK, ale pak nasleduje i nekolik odstavcu nesmyslu. Po prevodu takoveho
souboru do PDF Distillerem (nebo ps2pdf ci cimkoliv jinym) je tudiz
logicke, ze ani PDF soubor nelze tez zkonvertovat.

Proto by me zajimalo, zda ma nekdo s timto nejake zkusenosti, pripadne
zda by nekdo nevedel:

1. jake jsou moznosti konverze techto PS souboru vytvorenych ve Windows

2. pripadne jak pod Windows vytvorit z Wordu 95/97 takovy PS soubor,
ktery by bylo mozno prevest zpet na text s ceskymi znaky (predpokladam,
ze PDF vyrobeny z tohoto PS by jiz nemel delat problemy).

Dekuji za Vase nazory.

Pavel Hofman.


Další informace o konferenci Linux