ceske trideni podle ISO-8859-2

Alexandr Malusek malusek na hroch.ujf.cas.cz
Středa Duben 26 11:22:16 CEST 2000


dolik na nest.upol.cz (Jirka Jurek) writes:

> > Nevim, ale prinosnejsi by bylo napred tyto veci rozumne
> > standardizovat.
>
> Takze uz chybi jen adresa, kam muzeme posilat flame-mails za rozumny
> standart.

Proti diskusi nic nenamitam, ale pravdepodobne by ke zmene nevedla. O
tvorbe norem se muzete docist na http://www.csni.cz/.

> Do te doby bych navrhoval pri trideni uvazovat mezeru, jako je tomu 
> v jinych jazycich. (stacil by zamenit vyznam znaku mezera a nerozdelitelna
> mezera)

Namatkove jsem pod Linuxem vyzkousel jina locales:
$ cat f1
a b
a  c
$ LC_COLLATE=C sort f1
a  c
a b
$ LC_COLLATE=cs_CZ sort f1
a b
a  c
$ LC_COLLATE=fr_FR sort f1
a b
a  c
$ LC_COLLATE=da_DK sort f1
a  c
a b 

V tomto pripade locale fr_FR zachazi s mezerou podobne jako cs_CZ (do
detailu jsem to netestoval). Podobne se chova i rada jinych locales -
viz /usr/share/locale, zde vybirejte petiznakove retezce, dvouznakove
retezce definuji jen LC_MESSAGES. Napr. lze pouzit skript:

for i in $(cd /usr/share/locale/; echo ?????); do
  echo $i
  LC_COLLATE=$i sort f1
done

Nutnost revize CSN 97 6030 pro potreby pocitacoveho trideni je
uvidentni, ale nepredpokladam, ze novy navrh se bude vyrazne odlisovat
od standardu pro SIS (zde beru v potaz to, jak se normy vytvareji).
Vyse zmineny navrh na jine zachazeni s mezerou se mi sice po technicke
strance zda byt vyhodnejsi, ale neodpovida onomu standardu SIS, a tak
bych jeho implementaci povazoval spis za krok zpet.

V nejhorsim si muzete dodefinovat vlastni modifikovane ceske locale,
ktere bude s mezerami zachazet jinak. Melo by to byt jednodussi, nez
pouzivat nerozdelitelnou mezeru misto normalni mezery.

--
A. Malusek  (malusek na ujf.cas.cz)
UJF AV CR


Další informace o konferenci Linux