Problem s diakritikou vo FOP 0.20.4

Pavol Luptak Pavol.Luptak na i.cz
Neděle Listopad 3 03:15:55 CET 2002


Zdravim,
v prvom rade dakujem za radu - stravil som hackovanim FOPu a SAXONu 
nejaku tu hodinku ;-)

Martin Perina wrote:
> 
> 
> Saxon je pouze XSLT procesor, jako XML parser pouziva (pokud to 
> nepredefinujete) AELFRED, ktery je na tom hodne spatne s podporou
> vychodoevropskych jazyku. Doporucoval bych vam pouzivat SAXON 6.5.2
> (stabilni verze, ma oproti 6.4 opravenu spoustu chyby) v kombinaci 
> s tridami pro praci s XML katalogy od Normana Walshe
> (http://wwws.sun.com/software/xml/developers/resolver/), ktery
> pouziva Crimson nebo Xerces.

Najskor som skusal verziu Saxonu 6.4.4, ktora je default v debian sid.
Po vygenerovani FO a aplikovani FOPu 0.20.4 chybali niektore znaky v 
nadpisoch. Nainstaloval som teda verziu Saxon 6.5.2, kde uvedene chybne 
spravanie uz nie je a vsetky dalsie experimenty som realizoval so 
saxonom 6.5.2.

> 
> S xsltproc nemam osobni zkusenosti, ale z runych mailu z konference
> o DocBooku vyplyva, ze musite vzdy pouzivat uplne nejnovejsi verzi,
> protoze xsltproc ma pomerne bourlivy vyvoj.

Skusal som xsltproc verziu 1.0.21-0.2 (jeden z poslednych), rozdiel vo 
vystupnom dokumente generovanym saxonom a xsltprocom nebol takmer ziadny.

> 
> Fonty se daji stahnout z http://sourceforge.net/projects/corefonts/
> 
> Pro vygenerovani fontu postupujte podle navodu na
> http://xml.apache.org/fop/fonts.html
> 
> Muj konfiguracni skript pro FOP a XML katalog pro SAXON je prilozen.

Stiahol som fonty, rozbalil/nainstaloval, pre kazdy ttf font som podla 
navodu vygeneroval xml definicie, vytvoril som konfigurak (posielam v 
prilohe), ktory funguje bez problemov - som schopny generovat z FO 
objektov PDF vystup vo zvolenych fontoch (skusal som Arial, Times New Roman)
Vsetky znaky 'č, Č, ť, Ť, Ľ, ľ' su vo vystupnom pdf (plati aj o ps) 
dokumente nahradene znakom '#'. Vsetky ostatne diakriticke znaky su v 
poriadku.
Zaujimavostou je, ze xpdf pri takto FOPom vygenerovanom dokumente hodi 
'Segmentation fault), prezriet to ide len acrobat readerom 5.0 alebo cez 
ghostview.
Fakt netusim, preco akurat hore uvedene znaky su nahradene pri 
renderovani '#', skusal som fonty Arial, Courier, Times New Roman - tych 
par kritickych znakov je stale nahradenych za '#'.
FO objekty som generoval saxon 6.5.2 (skusal som aj xsltproc), vystup 
stale chybny.
Osobne to vidim na chybu vo FOPe, resp. v mojej konfiguracie.
Diky za akukolvek pomoc,

Pavol
-- 
___________________________________________________________________
[Pavol Luptak, ICZ a.s.] [Pavol.Luptak na i.cz] [tel: +420(2)81002222]
------------- další část ---------------
A non-text attachment was scrubbed...
Name: userconfig.xml
Type: text/xml
Size: 7971 bytes
Desc: [žádný popis není k dispozici]
URL: <http://www.linux.cz/pipermail/docbook/attachments/20021103/3c0d2a45/attachment.xml>


Další informace o konferenci Docbook