Chyba v triedeni cs_CZ & sk_SK

Pátek Červenec 18 19:44:49 CEST 2003

Ahoj!

> Jsou v zasade tri moznosti, jak se s tim poprat:
> 
> (0) "ch" vzdy pokladat za <c><h>, jinymi slovy se o zadnou chytristiku
>     nesnazit. To delaji "hloupe" programy.
> 
> (1) "ch" vzdy pokladat za <ch>.
>     To delaji "chytre" programy.
> 
> (2) ridit se normou a rozpoznavat, kdy "ch" znamena <ch> a kdy <c><h>.
>     To se snazi delat lide, ale v praxi s tim i oni maji problemy (je
>     treba pan Chomsky Slovan, takze by se mel radit pod <Ch> nebo
>     American, takze pod <Ch> nejspis nepatri?), tudiz tam, kde to neni
>     jasne, se i lide tezko shodnou a spis osciluji mezi (1) a (2).
> 
> Hlavni problem je, ze (2) podle vseho neni algoritmizovatelne (a libovolna
> algoritmicka aproximace, zda se, potrebuje velky slovnik) a ani (1) ani (2)
> se neshoduji s tim, co lide implicitne ocekavaji.
> 
> To povazuji za zakladni problem -- pravidla proste musi byt takova, aby se
> vsichni zucastneni (at uz lide nebo pocitace) shodli na tom, jak maji byt
> libovolna konkretni slova (modulo malicka mnozina vyjimek, ale opravdu jen
> malicka) razena, jinak ma pramaly smysl nejaka globalni pravidla zavadet.
> 
> Takze je asi na case neco zmenit: budto schopnosti programu interpretovat
> text (coz nevime, jak udelat) nebo pravidla samotna, coz je cesta sice
> trnita (uzivatele si budou muset zvyknout na zmenu), ale narozdil od cest
> ostatnich vede k cili :-)
> 
> Soucasna norma, jak uz bylo receno, dovoluje pri pocitacovem zpracovani
> pouzivat zjednodusena pravidla, takze navrhuji, aby se vytvoril standard,
> ktery bude rikat, jake presne zjednoduseni se ma pouzivat, aby bylo
> algoritmizovatelne a i pro cloveka snadno pochopitelne.

No, myslim ze definovat ze v pocitacich se
pouziva (1) je rozumne a pruchodne. Kontakty na
'Ustav pro jazyk cesky' mame (johanka ma
jeden hodne dobry :-))), takze co takhle
tu normu sepsat?
-- 
				Pavel
Written on sharp zaurus, because my Velo1 broke. If you have Velo you don't need...