SGML, XML, nastroje a zkusenosti (trochu dlouhe)
Jirka Kosek
jirka na kosek.cz
Pátek Duben 20 21:29:24 CEST 2001
Radek Hnilica wrote:
> Tedy jaky XSLT pouzit. Zkousel jsem XT, Xalan a Saxon, vse jen
> v Java verzi. Jednotlive procesory maji kazdy sve vlastni problemy:
> - cestina, tedy iso-8859-2. Jak XT tak Saxon me s prominutim
> nakopali do *CENSORED*. Tedy iso-8859-2 neni podporovano. U Xalanu
Upravená verze XT s podporou iso-8859-2 a windows-1250:
http://www.kosek.cz/xml/xt/
Saxon lze použít s libovolným parserem. Můžete použít například parser
Crimson, který umí všechna kódování, která umí vaše JVM. Popis na
použití Saxonu s Crimsonem a katalogovými soubory je na:
http://www.kosek.cz/xml/saxon/
Pokud vás nezajímají katalogy, stačí ve výše zmíněném popisu do
CLASSPATH přidat pouze saxon.jar a crimson.jar a jako třídu parseru
(parametry -x a -y) použít org.apache.crimson.parser.XMLReaderImpl.
> - schopnost stravit docbook.xsl, zkousel jsem zatim jen
> transformaci do HTML. XT se nelibilo xsl, pry nejaka nedefinovana
> promenna. Vyzkousel jse tedy jak posledni stable tak unstable verzi
XT se již 1,5 roku nevyvíjí a nepodporuje celý standard XSLT. Pokud vím,
tak poslední verze stylů je stále s XT kompatibilní (nefunguje však
například tvorba rejstříku). Některé starší verze stylů s XT nechodily.
DocBookové styly jsou nyní asi 14 dní hostovány na SourceForge, poslední
verze stylů je k dispozici na docbook.sourceforge.net.
> primo od Normana Welsche. S Xalanem jsem byl uspesnejsi, proti xsl
> neprotestoval, ale po nejakem case s prominutim chcipnul na nedostatek
> pameti. Jendine Saxon jsem rozchodil, a v tuhle chvili ho pouzivam,
> tedy zacal jsem.
Saxon je dle mého názoru nejlepší XSLT procesor, a s DocBookovými styly
je nejlepší používat právě Saxon. Některá rozšíření napsaná v Javě chodí
jen se Saxonem.
> Mate prosim nekdo zkusenosti z vycejazycnymy dokumenty? Tedy
> mam na mysli ze v jednom XML (pripadne SGML) jsou obe jazykove verze
> a prislusnym nastrojem pak vyseparuji jednu nebo druhou. Pripadne
> v dokumentu po nejakych celcich pisi jazykove mutace a ve vyslednem
> dokumentu se v pripade neexistence jedne mutace nektereho z celku pouzije
> mutace v druhem ci tretim preferovanem jazyku.
Ve většině případů je lepší oddělit jazykové verze do samostatných
dokumentů. Jednotlivé celky k překladu je možné rozsekat do souborů
pomocí entit a nějakým Makefilem do nekompletního překladu doplnit
chybějící části z originálu. Tímto způsobem se například překládá
dokumentace k PHP (cvs.php.net).
> Pokud jste se docetli az sem, dekuji Vam za trpelivost,
> a pokud budete moci zodpovedet nekterou z mych otazek, ci pomoci
> mi vlastni zkusenosti, budu Vam povdecen.
Příště dotazy tohotu druhu směřujte spíš do cz.comp.lang.xml.
-----------------------------------------------------------------
Jirka Kosek
e-mail: jirka na kosek.cz
http://www.kosek.cz
Další informace o konferenci Linux