RFC: Ceske zkratky mesicu v locales/glibc

Jan Kasprzak kas na fi.muni.cz
Pátek Březen 8 18:00:23 CET 2013


	Pekny patek preji,

uz delsi dobu mi vadi, ze ceske locales pouzivaji tripismenne
zkratky mesicu - vzdycky kdyz vidim "čen" nebo "čec" tak si rikam
"co to safra je?". Dokonce jsem se dokopal k tomu, abych o tom napsal
maintainerovi locales v glibc. Jeho nazor je, ze takovouto zmenu
je treba prodiskutovat v prislusne jazykove komunite uzivatelu, zjistit
celkovou naladu a mozne protiargumenty. Coz timto cinim.

	Moznosti jak resit zkratky mesicu jsou tyto:

1) pouzit rimske cislice. Vyhoda je, ze toto se skutecne v datech
   v cestine pouziva ("8. III. 2013, za vlady krale Milose I." :-).
   Dalsi vyhoda je, ze takto stanovene zkratky jsou skutecne
   zkratkami v tom smyslu, ze jsou kratsi nez puvodni nazvy mesicu.

2) pouzit cele nazvy mesicu ve 2. pade (8. března 2013). Takto to
   maji napriklad Rusove:

   $ LC_TIME=ru_RU.utf-8 date '+%b %B'
   марта Март

   Tohle je taky na rozdil od stavajiciho stavu citelne, pouziva se
   ve skutecne cestine, akorat to neni zkratka ve vyse uvedenem smyslu
   a neda se pouzit samostatne bez cisla dne v mesici (vypada to divne).

3) nechat stavajici stav - tripismenne zkratky ktere se nikde realne
   nepouzivaji. Jejich vyhoda ale je, ze vsechny zkratky jsou stejne
   dlouhe (a stejne dlouhe jako v anglictine). Nicmene je spousta locales,
   ktere tuto vlastnost nemaji (krome te rustiny i treba francouzstina),
   takze snad jsou internacionalizovane aplikace s tim uz nejak srozumeny.

	Jaky na to mate nazor, pripadne jake mate argumenty krome
vyse uvedenych? Ja za sebe preferuji 1).

	Dalsi souvisejici problem je, jestli nezmenit implicitni
znakovou sadu pro locale aliasy "cs" a "cs_CZ" tak, ze by toto byly
aliasy na "cs_CZ.UTF-8" misto stavajiciho "cs_CZ.ISO-8859-2".
Tohle by ale nejspis bylo dobre udelat pro vsechny jazyky, co jeste
porad maji 8-bitovou znakovou sadu jako implicitni.

-Yenya
 
P.S.: Asi nejkurioznejsi nastaveni je v japonstine, kde jsou
zkratky mesicu takto:

LC_TIME=ja_JP.utf-8 date '+%b %B'
 3月 3月
LC_TIME=ja_JP.utf-8 date '+%b %B' -d '2013-12-01'
12月 12月

Cimz maji zkratky prvnich deviti mesicu _delsi_ nez "nezkracene" nazvy,
ale zase maji vsechny zkratky tripismenne.

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| New GPG 4096R/A45477D5 - see http://www.fi.muni.cz/~kas/pgp-rollover.txt |
| http://www.fi.muni.cz/~kas/    Journal: http://www.fi.muni.cz/~kas/blog/ |
Please don't top post and in particular don't attach entire digests to your
mail or we'll all soon be using bittorrent to read the list.     --Alan Cox


Další informace o konferenci Linux