Chyba v triedeni cs_CZ & sk_SK

Michal Kubecek mike na mk-sys.cz
Středa Květen 28 21:57:59 CEST 2003


On Wed, May 28, 2003 at 06:26:30PM +0000, Honza Pazdziora wrote:

> Opravdu Vás současný stav světa v oblasti českého řazení už tak dlouho
> a tak moc trápí?

Ano, trápí mne už poměrně dlouho. Odhadoval bych to asi tak na 13 let,
konkrétně je to od chvíle, kdy jsem si poprvé musel napsat program pro
řazení DBF souboru, protože tehdejší dBase III řadila lexikograficky
podle ASCII kódů. Trápilo mne především to, že ať se budu snažit sebevíc,
i když implementuji libůstky jazykovědců jako je písmeno-nepísmeno 'ch'
nebo dvouprůchodové porovnávání, stejně to nebude stačit. Protože to
porovnávání řetězců pracuje s jakousi skrytou informací, která není
v těch řetězcích obsažena.

A trápí mne to dodnes. Samozřejmě je mi jasné, že na tomto fóru těžko
naleznu někoho, kdo by s tím mohl reálně něco udělat. Ale rád bych,
aby bylo aspoň vidět, že zdaleka ne všichni jsou se současným stavem
spokojeni. A že alespoň někdo by dal přednost pravidlům, která jsou
skutečně pravidly a ne jen jakýmsi mlhavým vodítkem.

Na druhou stranu jsem rád, že se jazykovědci ve své úporné snaze
komplikovat lidem život zastavili na půl cesty. Kdyby byli trochu
víc vynalézaví, mohli vymyslet pravidla pro řazení, která by nebyla
implementovatelná prostým porovnáváním dvojic řetězců. A to by byl
daleko větší problém. Doufám, že jim to nikdo neporadí.

                                                      Michal Kubeček



Další informace o konferenci Linux