ceske trideni podle ISO-8859-2
Alexandr Malusek
malusek na hroch.ujf.cas.cz
Středa Duben 26 11:22:16 CEST 2000
dolik na nest.upol.cz (Jirka Jurek) writes:
> > Nevim, ale prinosnejsi by bylo napred tyto veci rozumne
> > standardizovat.
>
> Takze uz chybi jen adresa, kam muzeme posilat flame-mails za rozumny
> standart.
Proti diskusi nic nenamitam, ale pravdepodobne by ke zmene nevedla. O
tvorbe norem se muzete docist na http://www.csni.cz/.
> Do te doby bych navrhoval pri trideni uvazovat mezeru, jako je tomu
> v jinych jazycich. (stacil by zamenit vyznam znaku mezera a nerozdelitelna
> mezera)
Namatkove jsem pod Linuxem vyzkousel jina locales:
$ cat f1
a b
a c
$ LC_COLLATE=C sort f1
a c
a b
$ LC_COLLATE=cs_CZ sort f1
a b
a c
$ LC_COLLATE=fr_FR sort f1
a b
a c
$ LC_COLLATE=da_DK sort f1
a c
a b
V tomto pripade locale fr_FR zachazi s mezerou podobne jako cs_CZ (do
detailu jsem to netestoval). Podobne se chova i rada jinych locales -
viz /usr/share/locale, zde vybirejte petiznakove retezce, dvouznakove
retezce definuji jen LC_MESSAGES. Napr. lze pouzit skript:
for i in $(cd /usr/share/locale/; echo ?????); do
echo $i
LC_COLLATE=$i sort f1
done
Nutnost revize CSN 97 6030 pro potreby pocitacoveho trideni je
uvidentni, ale nepredpokladam, ze novy navrh se bude vyrazne odlisovat
od standardu pro SIS (zde beru v potaz to, jak se normy vytvareji).
Vyse zmineny navrh na jine zachazeni s mezerou se mi sice po technicke
strance zda byt vyhodnejsi, ale neodpovida onomu standardu SIS, a tak
bych jeho implementaci povazoval spis za krok zpet.
V nejhorsim si muzete dodefinovat vlastni modifikovane ceske locale,
ktere bude s mezerami zachazet jinak. Melo by to byt jednodussi, nez
pouzivat nerozdelitelnou mezeru misto normalni mezery.
--
A. Malusek (malusek na ujf.cas.cz)
UJF AV CR
Další informace o konferenci Linux