Konverze PostScriptu (PDF) do TXT

Tomcat tomcat na cmail.cz
Pátek Červenec 14 04:58:06 CEST 2000


> ...tisk z Wordu 97 do PS a pote konverze do PDF pomoci Acrobat Distilleru.
> 1. jake jsou moznosti konverze techto PS souboru vytvorenych ve Windows

Bohuzel, reseni asi nenabidnu (spise zkusenosti)...
Generovani PS vystupu pod Win (a obecne lze vztahnout na libovolne
soubory generovane "user-friendly" aplikacemi jako je Word, FrontPage atd.)
je zatizeno existenci ohromneho mnozstvi "univerzalnich" maker, promennych
a jinych svinstev. Aby bylo mozne odstinit dummy uzivatele od nutnosti
naucit
se aspon neco malo, pokousi se programatori podobnych produktu pod tlakem
sveho dynamickeho managementu (cha) presunout pokud mozno co nejvetsi cast
uzivatelovy inteligence do programu. A pak to vypada tak jak to vypada.
Ale k problemu.
Pri tisku na PS zarizeni se pred kazdy dokument pridava tzv. PS header (tak
tomu
rikaji v US Win - nevim jak v ceskych). V principu je to nekolikakilovy
soubor
s definicemi vseho mozneho. Navic nektere aplikace jako treba CorelDraw
posilaji
vlastni hlavicky nezavisle na hlavickach PS driveru. Ve vlastnim tele
dokumentu
se misto PS prikazu pouzivaji prave makra definovana v hlavicce. Navic
skaredi
kapitalisti od Adobe a dalsich se i po deseti letech statecne brani
existenci
ISO-8859-2 a CP-1250, takze podpora cestiny je stale mizerna. Ne kazdemu
doslo,
ze nase nabodenicka se koduji pomoci ruznych Ccaron apod. a pouzivaji ruzne
vlastni encodingy a makra a ja nevim co vsechno jeste.
Vetsina programu na vytahnuti txt z pdf, ktere jsem videl, nema schopnost
vycucnout
text z podobne zmrsenych dokumentu, takze tudy asi cesta nepovede.
Z vlastni zkusenosti (DTP) vim, ze velmi casto je problem vubec donutit PS
tiskarnu
nebo osvitovou jednotku, aby akceptovala PS paskvil vyprodukovany wokennimi
programy
nemluve o cestine.
Spis nechapu, proc psat text ve Wordu, vyplivnout ho v PS, prevest do PDF a
pak
z toho zpatky cucat text? Proc neexportovat txt primo z doc?????

> 2. pripadne jak pod Windows vytvorit z Wordu 95/97 takovy PS soubor,
> ktery by bylo mozno prevest zpet na text s ceskymi znaky (predpokladam,
> ze PDF vyrobeny z tohoto PS by jiz nemel delat problemy).

Jak uz jsem napsal vyse, kterykoliv program od M$ vyrabi totalni zmrseniny a
lze
rict, ze vetsina ostatnich Win aplikaci taky (cest svetlym vyjimkam...). Z
hlediska
"kancelarskeho" uzivatele bych to snad mohl chapat, z hlediska systemaka a
programatora
se mi zveda zaludek. Obavam se, ze problem ziskani "prenositelneho" PS z DOC
je
naprosto neresitelny, protoze uz sam obsah DOC souboru je neskutecna
prasarna a
neumim si predstavit JAKYKOLIV konvertor, ktery by si s tim dokazal
univerzalne
poradit. Neco o tom vim, protoze kdysi jsem se pokousel napsat konverzni
knihovnu.
Do formatu DOC se prevadi celkem v pohode, ale opacne to snad ani nejde. V
extremnich
pripadech (chapej - kdyz je pisatel dokumentu DOC totalni prase nebo
absolutne nema
paru o tom jak to funguje) dokonce v DOCu nemusi byt ani slova jedne vety za
sebou
v tom poradi, v jakem se objevuji na obrazovce. Blbe se to vysvetluje -
lepsi je to
videt. Staci si otevrit par DOCu textovym/binarnim prohlizecem treba ve FARu
nebo
v Nortonu. A ti nadsenci, kteri maji zapnute tzv. Rychle ukladani
(=inkrementalni)
se mohou casto dockat toho, ze po desatem ci dvacatem ulozeni dokumentu uz
ho nikdy
neotevrou. Dalsi priklad - sprava verzi. Totalni paskvil.

Pro flamewaristy: Vim presne o cem pisu. Uz leta delam spravu a technickou
podporu
prave Win a jejich aplikaci. Cim dyl to delam, tim vic me tyhle produkty
ser....
Mam pocit, ze jediny duvod jejich masoveho pouzivani je to, aby armada M$
programatoru
a pracovniku tech. podpory mela navzdy zajisten nemaly prijem $$$$. Nebudu
tajit,
ze me to zivi taky - a dobre. Posledni tri roky delam i Linux (na intelu,
m68k a PPC)
a s podobnymi problemy se setkavam zridka. Ovsem chapu bezneho lamera, ze
dela s Woknama.
Za prve je dostane "zdarma" s PC a za druhe klikat mysi dokaze kazda cvicena
opice. Tecka.

Omlouvam se za to, ze jsem se tak "rozkecal".      TomCat



Další informace o konferenci Linux