Chyba v triedeni cs_CZ & sk_SK

Petr Stehlik pstehlik na sophics.cz
Středa Květen 28 12:29:19 CEST 2003


On St, 2003-05-28 at 11:24, Michal Kubecek wrote:
> To je právě ten hlavní problém. Není možné algoritmicky poznat,
> zda je posloupnost 'ch' dvojicí písmen 'c', 'h' nebo jedním
> písmenem 'ch'. Přesto jazykovědci trvají na tom, že (aspoň
> v češtině) je 'ch' písmeno. Tedy někdy.
> 
> Současný stav je nekonzistentní a přínáší řadu problémů. Možná
> řešení jsou dvě:
> 
> 1. Zavést 'ch' jako znak, alokovat pro něj Unicode reprezentaci
> a upravit veškerý software tak, aby s touto reprezentací pracoval.
> Pak bude vždy jasné, zda se jedná o jeden znak nebo dvojici znaků.
> Vzniká ale samozřejmě otázka, co dělat s ne-Unicode softwarem.

Krome tohodle by IMHO vznikl dalsi problem, a sice chyby v nove psanych
UNICODE dokumentech, kdy by clovek chtel napsat "ch" a misto toho by
napsal "c""h" (protoze by jeste nebyl zvyknuty na novou 'ch' klavesu).

> 2. Odkázat jazykovědce s jejich mlhavě formulovanými "pravidly"
> pro porovnávání řetězců do patřičných míst a pracovat s 'ch' jako
> s dvojicí znaků (včetně porovnávání řetězců).
> 
> Osobně hlasuji pro variantu 2.

Ja rozhodne taky. Aspon neco uzitecneho by jazykovedci udelali pro
cestinu driv, nez bude nahrazena nejakym globalnim jazykem.

Petr




Další informace o konferenci Linux