SGML, XML, nastroje a zkusenosti (trochu dlouhe)

Jirka Kosek jirka na kosek.cz
Pátek Duben 20 21:29:24 CEST 2001


Radek Hnilica wrote:

>         Tedy jaky XSLT pouzit.  Zkousel jsem XT, Xalan a Saxon, vse jen
> v Java verzi.  Jednotlive procesory maji kazdy sve vlastni problemy:
>         - cestina, tedy iso-8859-2.  Jak XT tak Saxon me s prominutim
> nakopali do *CENSORED*.  Tedy iso-8859-2 neni podporovano.  U Xalanu

Upravená verze XT s podporou iso-8859-2 a windows-1250:
	http://www.kosek.cz/xml/xt/

Saxon lze použít s libovolným parserem. Můžete použít například parser
Crimson, který umí všechna kódování, která umí vaše JVM. Popis na
použití Saxonu s Crimsonem a katalogovými soubory je na:
	http://www.kosek.cz/xml/saxon/

Pokud vás nezajímají katalogy, stačí ve výše zmíněném popisu do
CLASSPATH přidat pouze saxon.jar a crimson.jar a jako třídu parseru
(parametry -x a -y) použít org.apache.crimson.parser.XMLReaderImpl.

>         - schopnost stravit docbook.xsl, zkousel jsem zatim jen
> transformaci do HTML.  XT se nelibilo xsl, pry nejaka nedefinovana
> promenna.  Vyzkousel jse tedy jak posledni stable tak unstable verzi

XT se již 1,5 roku nevyvíjí a nepodporuje celý standard XSLT. Pokud vím,
tak poslední verze stylů je stále s XT kompatibilní (nefunguje však
například tvorba rejstříku). Některé starší verze stylů s XT nechodily.
DocBookové styly jsou nyní asi 14 dní hostovány na SourceForge, poslední
verze stylů je k dispozici na docbook.sourceforge.net.

> primo od Normana Welsche.  S Xalanem jsem byl uspesnejsi, proti xsl
> neprotestoval, ale po nejakem case s prominutim chcipnul na nedostatek
> pameti.  Jendine Saxon jsem rozchodil, a v tuhle chvili ho pouzivam,
> tedy zacal jsem.

Saxon je dle mého názoru nejlepší XSLT procesor, a s DocBookovými styly
je nejlepší používat právě Saxon. Některá rozšíření napsaná v Javě chodí
jen se Saxonem. 
 
>         Mate prosim nekdo zkusenosti z vycejazycnymy dokumenty?  Tedy
> mam na mysli ze v jednom XML (pripadne SGML) jsou obe jazykove verze
> a prislusnym nastrojem pak vyseparuji jednu nebo druhou.  Pripadne
> v dokumentu po nejakych celcich pisi jazykove mutace a ve vyslednem
> dokumentu se v pripade neexistence jedne mutace nektereho z celku pouzije
> mutace v druhem ci tretim preferovanem jazyku.

Ve většině případů je lepší oddělit jazykové verze do samostatných
dokumentů. Jednotlivé celky k překladu je možné rozsekat do souborů
pomocí entit a nějakým Makefilem do nekompletního překladu doplnit
chybějící části z originálu. Tímto způsobem se například překládá
dokumentace k PHP (cvs.php.net). 
 
>         Pokud jste se docetli az sem, dekuji Vam za trpelivost,
> a pokud budete moci zodpovedet nekterou z mych otazek, ci pomoci
> mi vlastni zkusenosti, budu Vam povdecen.

Příště dotazy tohotu druhu směřujte spíš do cz.comp.lang.xml.

-----------------------------------------------------------------
  Jirka Kosek  	                     
  e-mail: jirka na kosek.cz
  http://www.kosek.cz


Další informace o konferenci Linux