dělení slov

Jirka Kosek jirka na kosek.cz
Středa Srpen 25 11:16:50 CEST 2004


Marie Mertová wrote:

> Píši dokumentaci v Docbooku a narazila jsem na problém s dělením slov. Postupovala jsem podle doporučení J.Koska, do souboru xep/etc/hyphens.xml jsem přidala požadovanou instrukci 
> <hyphen language="cs" table="czhyphen.il2" codelist="il2codes.xml"/>. 
> Některá česká slova se mi však rozdělila nesprávně, např. prosstře-dnictvím, zatí-mco, samos-tatně,
> stejnoj-menný, uko-nčení, je-dnu, odpole-dní, chara-kteritická, přípa-dně.
> Pokud jsem takové slovo zařadila do tabulky czhyphen.cz se správným pravidlem pro dělení (např. 
> stej-no-jmen-ný), dělení slova v textu pak bylo správné. Kdybych ale musela takto postupovat pro každé nalezené špatně rozdělené slovo, připadalo by mi to dosti pracné. Nejde to jinak? Díky za radu.

Jinak to bohužel nejde, výjimky si člověk musí ručně zadat do souboru se 
vzory pro dělení. XEP bohužel nemá úplně dobrý algoritmus pro dělení 
slov a pro češtinu se občas netrefí.

-- 
------------------------------------------------------------------
   Jirka Kosek     e-mail: jirka na kosek.cz     http://www.kosek.cz
------------------------------------------------------------------
   Profesionální školení a poradenství v oblasti technologií XML.
      Podívejte se na náš nově spuštěný web http://DocBook.cz
------------------------------------------------------------------
------------- další část ---------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/x-pkcs7-signature
Size: 3158 bytes
Desc: S/MIME Cryptographic Signature
URL: <http://www.linux.cz/pipermail/docbook/attachments/20040825/8e8e87c7/attachment.bin>


Další informace o konferenci Docbook