Chyba v triedeni cs_CZ & sk_SK
Milan Kerslager
milan.kerslager na pslib.cz
Pondělí Květen 26 20:35:23 CEST 2003
On Mon, May 26, 2003 at 06:42:21PM +0200, Michal Dobes wrote:
> Honza Houstek napsal(a):
> >>Par mesicu zpet jsem mel diskusi s jednim clovickem na tema ceske
> >>trideni. Ten mi rikal, ze jde udelat spravne ceske trideni, nebot maji
> >>nejaky system na zpracovavani textu (jsou vydavatelstvi), co obsahuje
> >>cesky spravne trideni. Soucasti tridiciho algoritmu pro cestinu je
> >>nekolik GB velka databaze. :-)
> >
> > Ano, to sedi. Musi to mit minimalne nejaky slovnik, pomoci ktereho dokaze
> > slova rozsekat na slabiky, a mozna jeste neco dalsiho.
>
> Tahle cast problemu je jeste zkousnutelna.
> Nase norma ma znat (co si z te diskuse pamatuji) v podstate
> dva druhy trideni - syntakticke a semanticke. Pokud si vzpominam,
> tak v prvnim pripade by pro slova Karel II a Karel IV bylo spravne
> poradi Karel IV, Karel II, protoze tyto vyrazy se tridi tak, ze se to
> prevede na 'Karel druhy' a 'Karel ctvrty', a to se setridi dle dalsich
> pravidel.
> V druhem typu trideni musim vedet, ze Karel II i IV byly historicke
> osobnosti, pricemz Karel II zil drive, proto bude pri trideni uveden
> drive, atd.
> A zatim jste se v diskusi nedostali dal, nez v prehazovani pismenek
> mezi sebou v ramci jednoho slova. :-)
>
> Pruser je, pokud se pohybujete v prostredi, kde se zakaznikovi
> treba zavazujete, ze vsechny normy CSN jsou pro vas zavazne,
> pak muze z nekterych zacit bolet pekne hlava. Doufam, ze zadny
> nas produkt nikde nic netridi vyjma cisel. :-((
Komu se nelibi ceske trideni (ktere by melo byt maximalne podle normy),
pak at pouzije LANG=en sort nebo neco podobneho, aby se uspokojil.
Urcite je nevhodne nabadat ke sprzneni ceskych locales.
--
Milan Kerslager
E-mail: milan.kerslager na pslib.cz
WWW: http://www.pslib.cz/~kerslage/
Další informace o konferenci Linux