ceske trideni podle ISO-8859-2

Jirka Jurek dolik na nest.upol.cz
Pátek Duben 21 14:27:45 CEST 2000


Pouzivam trideni pomoci locales a funkce strcoll z glibc-2.1

setrideni v us kodovani vypada:
" 2"
"10"
to same v cs_CZ (ISO-8859-2):
"10"
" 2"

Norma na
http://www.usiscr.cz/cz/standardy/tecstd08.html
rika:
"Skupiny slov se radi postupne podle jednotlivych slov tvoricich skupinu,
pri cemz nezalezi na poctu mezer, ktere oddeluji slova."
         ^^^^^^^^
a dale
"Cislice se radi podle jejich ciselne hodnoty vzestupne za abecedu." 

Problem ovsem je, ze v implementaci normy
ftp://ftp.fi.muni.cz/pub/localization/locale/cs_CZ
/usr/share/i18n/locales/cs_CZ
je uvedeno:
" Odlisnosti od normy:
3.10:
Cisla nejsou razena podle ciselne hodnoty, ale podle hodnoty jednotlivych
cislic."

Problem se da obejit, pokud pouziji tzv. nerozdelitelnou mezeru (0xA0)
http://www.usiscr.cz/iso-8859-2/cz/standardy/tectab01.html
misto normalni mezery (0x20). Pak jsou cislice setrizeny spravne, protoze
nerozdelitelna mezera se radi pred cislice a pismena.

Takze bych se jeste rad dozvedel, jak se nejcasteji pise znak 
nerozdelitelna mezera v ruznych editorech? 
A dale, jestli se chystaji dalsi upravy ceskych locales v glibc?


Predem diky za vsechny podnety

Jirka Jurek



Další informace o konferenci Linux