Chyba v triedeni cs_CZ & sk_SK
Pavel Machek
pavel na ucw.cz
Pátek Červenec 18 19:44:49 CEST 2003
Ahoj!
> Jsou v zasade tri moznosti, jak se s tim poprat:
>
> (0) "ch" vzdy pokladat za <c><h>, jinymi slovy se o zadnou chytristiku
> nesnazit. To delaji "hloupe" programy.
>
> (1) "ch" vzdy pokladat za <ch>.
> To delaji "chytre" programy.
>
> (2) ridit se normou a rozpoznavat, kdy "ch" znamena <ch> a kdy <c><h>.
> To se snazi delat lide, ale v praxi s tim i oni maji problemy (je
> treba pan Chomsky Slovan, takze by se mel radit pod <Ch> nebo
> American, takze pod <Ch> nejspis nepatri?), tudiz tam, kde to neni
> jasne, se i lide tezko shodnou a spis osciluji mezi (1) a (2).
>
> Hlavni problem je, ze (2) podle vseho neni algoritmizovatelne (a libovolna
> algoritmicka aproximace, zda se, potrebuje velky slovnik) a ani (1) ani (2)
> se neshoduji s tim, co lide implicitne ocekavaji.
>
> To povazuji za zakladni problem -- pravidla proste musi byt takova, aby se
> vsichni zucastneni (at uz lide nebo pocitace) shodli na tom, jak maji byt
> libovolna konkretni slova (modulo malicka mnozina vyjimek, ale opravdu jen
> malicka) razena, jinak ma pramaly smysl nejaka globalni pravidla zavadet.
>
> Takze je asi na case neco zmenit: budto schopnosti programu interpretovat
> text (coz nevime, jak udelat) nebo pravidla samotna, coz je cesta sice
> trnita (uzivatele si budou muset zvyknout na zmenu), ale narozdil od cest
> ostatnich vede k cili :-)
>
> Soucasna norma, jak uz bylo receno, dovoluje pri pocitacovem zpracovani
> pouzivat zjednodusena pravidla, takze navrhuji, aby se vytvoril standard,
> ktery bude rikat, jake presne zjednoduseni se ma pouzivat, aby bylo
> algoritmizovatelne a i pro cloveka snadno pochopitelne.
No, myslim ze definovat ze v pocitacich se
pouziva (1) je rozumne a pruchodne. Kontakty na
'Ustav pro jazyk cesky' mame (johanka ma
jeden hodne dobry :-))), takze co takhle
tu normu sepsat?
--
Pavel
Written on sharp zaurus, because my Velo1 broke. If you have Velo you don't need...
Další informace o konferenci Linux