Chyba v triedeni cs_CZ & sk_SK

Milan Kerslager milan.kerslager na pslib.cz
Pondělí Květen 26 20:35:23 CEST 2003


On Mon, May 26, 2003 at 06:42:21PM +0200, Michal Dobes wrote:
> Honza Houstek napsal(a):
> >>Par mesicu zpet jsem mel diskusi s jednim clovickem na tema ceske
> >>trideni. Ten mi rikal, ze jde udelat spravne ceske trideni, nebot maji
> >>nejaky system na zpracovavani textu (jsou vydavatelstvi), co obsahuje
> >>cesky spravne trideni. Soucasti tridiciho algoritmu pro cestinu je
> >>nekolik GB velka databaze. :-)
> > 
> > Ano, to sedi. Musi to mit minimalne nejaky slovnik, pomoci ktereho dokaze
> > slova rozsekat na slabiky, a mozna jeste neco dalsiho.
> 
> Tahle cast problemu je jeste zkousnutelna.
> Nase norma ma znat (co si z te diskuse pamatuji) v podstate
> dva druhy trideni - syntakticke a semanticke. Pokud si vzpominam,
> tak v prvnim pripade by pro slova Karel II a Karel IV bylo spravne
> poradi Karel IV, Karel II, protoze tyto vyrazy se tridi tak, ze se to
> prevede na 'Karel druhy' a 'Karel ctvrty', a to se setridi dle dalsich
> pravidel.
> V druhem typu trideni musim vedet, ze Karel II i IV byly historicke
> osobnosti, pricemz Karel II zil drive, proto bude pri trideni uveden
> drive, atd.
> A zatim jste se v diskusi nedostali dal, nez v prehazovani pismenek
> mezi sebou v ramci jednoho slova. :-)
> 
> Pruser je, pokud se pohybujete v prostredi, kde se zakaznikovi
> treba zavazujete, ze vsechny normy CSN jsou pro vas zavazne,
> pak muze z nekterych zacit bolet pekne hlava. Doufam, ze zadny
> nas produkt nikde nic netridi vyjma cisel. :-((

Komu se nelibi ceske trideni (ktere by melo byt maximalne podle normy),
pak at pouzije LANG=en sort nebo neco podobneho, aby se uspokojil.
Urcite je nevhodne nabadat ke sprzneni ceskych locales.

-- 
                        Milan Kerslager
                        E-mail: milan.kerslager na pslib.cz
                        WWW:    http://www.pslib.cz/~kerslage/


Další informace o konferenci Linux