Chyba v triedeni cs_CZ & sk_SK

Michal Dobes dobes na tesnet.cz
Pondělí Květen 26 18:42:21 CEST 2003


Honza Houstek napsal(a):
>>Par mesicu zpet jsem mel diskusi s jednim clovickem na tema ceske
>>trideni. Ten mi rikal, ze jde udelat spravne ceske trideni, nebot maji
>>nejaky system na zpracovavani textu (jsou vydavatelstvi), co obsahuje
>>cesky spravne trideni. Soucasti tridiciho algoritmu pro cestinu je
>>nekolik GB velka databaze. :-)
> 
> 
> Ano, to sedi. Musi to mit minimalne nejaky slovnik, pomoci ktereho dokaze
> slova rozsekat na slabiky, a mozna jeste neco dalsiho.
> 

Tahle cast problemu je jeste zkousnutelna.
Nase norma ma znat (co si z te diskuse pamatuji) v podstate
dva druhy trideni - syntakticke a semanticke. Pokud si vzpominam,
tak v prvnim pripade by pro slova Karel II a Karel IV bylo spravne
poradi Karel IV, Karel II, protoze tyto vyrazy se tridi tak, ze se to
prevede na 'Karel druhy' a 'Karel ctvrty', a to se setridi dle dalsich
pravidel.
V druhem typu trideni musim vedet, ze Karel II i IV byly historicke
osobnosti, pricemz Karel II zil drive, proto bude pri trideni uveden
drive, atd.
A zatim jste se v diskusi nedostali dal, nez v prehazovani pismenek
mezi sebou v ramci jednoho slova. :-)

Pruser je, pokud se pohybujete v prostredi, kde se zakaznikovi
treba zavazujete, ze vsechny normy CSN jsou pro vas zavazne,
pak muze z nekterych zacit bolet pekne hlava. Doufam, ze zadny
nas produkt nikde nic netridi vyjma cisel. :-((

	Majkl



Další informace o konferenci Linux