Chyba v triedeni cs_CZ & sk_SK

Honza Pazdziora adelton na fi.muni.cz
Čtvrtek Květen 29 11:16:05 CEST 2003


On Wed, May 28, 2003 at 07:58:18PM +0000, Michal Kubecek wrote:
> 
> Ano, trápí mne už poměrně dlouho. Odhadoval bych to asi tak na 13 let,
> konkrétně je to od chvíle, kdy jsem si poprvé musel napsat program pro
> řazení DBF souboru, protože tehdejší dBase III řadila lexikograficky
> podle ASCII kódů. Trápilo mne především to, že ať se budu snažit sebevíc,
> i když implementuji libůstky jazykovědců jako je písmeno-nepísmeno 'ch'
> nebo dvouprůchodové porovnávání, stejně to nebude stačit. Protože to

A proč jste to vlastně dělal? Proč jste implementoval řazení jiné než
podle ordinálních hodnot ASCII znaků, když jenom tohle se Vám jeví
rozumné? Nebylo to náhodou proto, že uživatelé (= normální lidé), pro
které jste ty výstupy dělal, nepovažovali zažité řazení za blbost, ale
za věc přirozenou? A tudíž očekávali, že nebudete špekulovat nad tím,
jak to obejít a vokecat, ale prostě dodáte výstup řazený podle
očekávaných postupů? Plus mínus?

> porovnávání řetězců pracuje s jakousi skrytou informací, která není
> v těch řetězcích obsažena.
>
> A trápí mne to dodnes. Samozřejmě je mi jasné, že na tomto fóru těžko

Popravdě řečeno, pokud se zeptáte náhodně lidí na ulici, asi nebudou
mít jednotný názor na to, jak se má řadit Karel IV vs. Karel II.
A ještě míň pravděpodobné je, že ten jejich názor bude kompatibilní
s textem normy. Čili ano, bylo by pěkné s tou skrytou informací
pracovat, ale od jisté úrovně náklady na takové zpracování převýší
návratnost. A nemá cenu kvůli tomu truchlit nebo nespat.

> naleznu někoho, kdo by s tím mohl reálně něco udělat. Ale rád bych,
> aby bylo aspoň vidět, že zdaleka ne všichni jsou se současným stavem
> spokojeni. A že alespoň někdo by dal přednost pravidlům, která jsou
> skutečně pravidly a ne jen jakýmsi mlhavým vodítkem.

:-) To správné fórum pro změnu pravidel řazení češtiny tady opravdu
není, a pokud se zeptáte na názor knihovníků / jazykovědců, tak Vám
řeknou, že přece ta norma pravidla obsahuje. Mám ji před sebou a nic
mlhavého tam nevidím.

Na druhou stranu pokud máte pocit, že počítačové implementace normy
a zažitých zvyklostí by měly být lepší, sem s nápady -- nějakou
souvislost s Linuxem tam asi ještě pořád dohledáme. :-)

> Na druhou stranu jsem rád, že se jazykovědci ve své úporné snaze
> komplikovat lidem život zastavili na půl cesty. Kdyby byli trochu
> víc vynalézaví, mohli vymyslet pravidla pro řazení, která by nebyla
> implementovatelná prostým porovnáváním dvojic řetězců. A to by byl
> daleko větší problém. Doufám, že jim to nikdo neporadí.

No, pokud Vám opravdu jde o to svět napravit a zjednodušit, možná by
bylo dobré nejdřív narovnat svůj postoj k jazykovědcům, protože je
dost pravděpodobné, že v průběhu toho napravování a zjednodušování
budete mnohokrát jednat právě s nimi. ;-)))

-- 
------------------------------------------------------------------------
 Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
 .project: Perl, mod_perl, DBI, Oracle, auth. WWW servers, XML/XSL, ...
		Only self-confident people can be simple.


Další informace o konferenci Linux