RFC: Ceske zkratky mesicu v locales/glibc
Jan Kasprzak
kas na fi.muni.cz
Pátek Březen 8 18:00:23 CET 2013
Pekny patek preji,
uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
"co to safra je?". Dokonce jsem se dokopal k tomu, abych o tom napsal
maintainerovi locales v glibc. Jeho nazor je, ze takovouto zmenu
je treba prodiskutovat v prislusne jazykove komunite uzivatelu, zjistit
celkovou naladu a mozne protiargumenty. Coz timto cinim.
Moznosti jak resit zkratky mesicu jsou tyto:
1) pouzit rimske cislice. Vyhoda je, ze toto se skutecne v datech
v cestine pouziva ("8. III. 2013, za vlady krale Milose I." :-).
Dalsi vyhoda je, ze takto stanovene zkratky jsou skutecne
zkratkami v tom smyslu, ze jsou kratsi nez puvodni nazvy mesicu.
2) pouzit cele nazvy mesicu ve 2. pade (8. března 2013). Takto to
maji napriklad Rusove:
$ LC_TIME=ru_RU.utf-8 date '+%b %B'
марта Март
Tohle je taky na rozdil od stavajiciho stavu citelne, pouziva se
ve skutecne cestine, akorat to neni zkratka ve vyse uvedenem smyslu
a neda se pouzit samostatne bez cisla dne v mesici (vypada to divne).
3) nechat stavajici stav - tripismenne zkratky ktere se nikde realne
nepouzivaji. Jejich vyhoda ale je, ze vsechny zkratky jsou stejne
dlouhe (a stejne dlouhe jako v anglictine). Nicmene je spousta locales,
ktere tuto vlastnost nemaji (krome te rustiny i treba francouzstina),
takze snad jsou internacionalizovane aplikace s tim uz nejak srozumeny.
Jaky na to mate nazor, pripadne jake mate argumenty krome
vyse uvedenych? Ja za sebe preferuji 1).
Dalsi souvisejici problem je, jestli nezmenit implicitni
znakovou sadu pro locale aliasy "cs" a "cs_CZ" tak, ze by toto byly
aliasy na "cs_CZ.UTF-8" misto stavajiciho "cs_CZ.ISO-8859-2".
Tohle by ale nejspis bylo dobre udelat pro vsechny jazyky, co jeste
porad maji 8-bitovou znakovou sadu jako implicitni.
-Yenya
P.S.: Asi nejkurioznejsi nastaveni je v japonstine, kde jsou
zkratky mesicu takto:
LC_TIME=ja_JP.utf-8 date '+%b %B'
3月 3月
LC_TIME=ja_JP.utf-8 date '+%b %B' -d '2013-12-01'
12月 12月
Cimz maji zkratky prvnich deviti mesicu _delsi_ nez "nezkracene" nazvy,
ale zase maji vsechny zkratky tripismenne.
--
| Jan "Yenya" Kasprzak <kas at {fi.muni.cz - work | yenya.net - private}> |
| New GPG 4096R/A45477D5 - see http://www.fi.muni.cz/~kas/pgp-rollover.txt |
| http://www.fi.muni.cz/~kas/ Journal: http://www.fi.muni.cz/~kas/blog/ |
Please don't top post and in particular don't attach entire digests to your
mail or we'll all soon be using bittorrent to read the list. --Alan Cox
Další informace o konferenci Linux