PostgreSQL na SuSE 8.1 - české třídění

Úterý Leden 14 11:28:07 CET 2003

On Tue, Jan 14, 2003 at 09:58:35AM +0100, Krištof Petr wrote:
> Milan Kerslager wrote:
> >>P.S. miluju unicode 
> >
> >
> >unicode znamena penalizaci vykonu, protoze nelze porovnavat jednotlive
> >bajty a musi se pocitat s vicebajtovymi znaky. Reseni je to tedy hezke,
> >ale ma to sva "ALE".
> >
> 
> Tyka se to i UTF-16?

 Multi-byte kodovani je vice: EUC-JP, EUC-KR, ISO 2022-JP, Shift-JIS, Big5, UHC, UTF-*
 Dobre ctivo je napr.: http://www.debian.org/doc/manuals/intro-i18n/

 Nemyslim vsak, ze by UTF znamenalo penalizaci vykonu pokud prostredi
 je plne unicodove a neni nutne prekodovavat. Porovnat dva UTF retezce
 je stejne jako porovnat jakekoliv jine retezce. Co je jine jsou veci
 ktere jsou v cecku v <ctype.h> (klasifikace jednotlivych znaku -
 mala/velka pismena apod.) a pak snad jeste hledani znaku v retezci,
 ktere pokud je hledanym znakem multibyte znak se stava hledanim
 podretezce v retezci. To je vse. Tedy v solidne napsanem systemu
 pokud nepouzivate veci jako ignorovani velikosti pismen a mixovani
 ruznych kodovani by mel byt vykon podobny -- mozna budete myt trosku
 plnejsi pamet :-)

 BTW, to mixovani kodovani a nutnost prekodovavat je naprosto bezne pokud 
 napriklad pouzivate GTK-2.x v systemu s Latin2 locale (muj debian :-). Z 
 tohoto pohledu je RH8 mozna naopak cesta k vetsi efektivite a vykonu.

    Karel

-- 
 Karel Zak  <zakkr na zf.jcu.cz>
 http://home.zf.jcu.cz/~zakkr/