trideni `ch'

Alexandr Malusek malusek na hroch.ujf.cas.cz
Čtvrtek Září 18 13:37:19 CEST 1997


Domnival jsem se, ze problematiku vyjasnim zpristupnenim
normy. Bohuzel tak nemohu ucinit, tak se alespon pokusim korigovat
nektere nazory.

=?ISO-8859-2?Q?Hanu=B9_Adler?= <had na pdas.cz> writes:

> Myslim, ze to je hovadina. Pokud je v Cechach zvykem tridit `ch' mezi
> `h' a `i' a nikoli jako `c' `h', je treba to respektovat a ne vymyslet
> si slozita oduvodneni proc to nemusi byt, kdyz to moje databaze
> nepodporuje.

<Citace z CSN 97 6030>
Pokud programove vybaveni, v jehoz prostredi je realizovan
automatizovany informacni system pracujici s textovymi objekty a
provadejici jejich razeni podle standardizovane ceske narodni abecedy,
neposkytuje moznost spravneho zarazeni pismena CH mezi pismena H a I,
pripousti se docasne razeni pismena CH pod pismeno C.
</Citace z CSN 97 6030>

Tridici algoritmus funkce strcoll (myslim, ze popis jeho moznosti je v
XPG4.2. Linux jej, myslim, zatim plne neimplementuje) umoznuje spravne
tridit znak 'ch', ale neumoznuje pracovat s vyjimkami typu
nanichodny. (Pokud vim, tak ani tridici algoritmy Sybase a Oracle toto
neumoznuji). Tedy implementace trideni 'ch' jako 'c' a 'h' by
_vyhovovala_ norme, pokud by Linux implementoval locales podle
XPG4.2. Trideni 'ch' jako 'ch' by normu naopak porusovalo, nebot by
nedokazalo zpracovat ony vyjimky.

Prosim, berte to jako ciste _technickou_ poznamku, osobni nazory
zde neuvadim.


uhlar na ccnews.ke.sanet.sk (Matus Uhlar) writes:

> Nuz a aka je ceska triediaca norma ? vari ina ako a a' b c c~ ... ?
> okrem ch samozrejme :)

Ano, je jina. Vychazi ze standardizovane ceske narodni abecedy

      v                                  v   v               v
a b c c d e f g h ch i j k l m n o p q r r s s t u v w x y z z

Tato pismena maji tzv. primarni radici platnost (v ramci ni jsou
'a' a 'dlouhe a' ekvivalentni z hlediska razeni).

Teprve jsou-li obe tridena slova shodna (z hlediska primarni radici
platnosti), prihlizi se k tzv. sekundarni radici platnosti. Tam
je napred 'a' a pak teprve 'dlouhe a' ... . Podrobnosti viz norma.
locales podle XPG4.2 toto umoznuji implementovat.

Pozn.: Slovenska norma je obdobna, nebot vychazi ze starsi normy CSN
(snad CSN 01 0181, ale nejsem si tim jist).

Timto prispevkem nechci vyvolavat dalsi debatu, jenom jsem chtel
nektere nepresne nazory poopravit a ukazat, ze problem je hlubsi nez
se na prvni pohled zda.

--
A. Malusek  (malusek na ujf.cas.cz)
UJF AV CR


Další informace o konferenci Linux