PostgreSQL na SuSE 8.1 - české třídění
Karel Zak
zakkr na zf.jcu.cz
Úterý Leden 14 11:28:07 CET 2003
On Tue, Jan 14, 2003 at 09:58:35AM +0100, Krištof Petr wrote:
> Milan Kerslager wrote:
> >>P.S. miluju unicode
> >
> >
> >unicode znamena penalizaci vykonu, protoze nelze porovnavat jednotlive
> >bajty a musi se pocitat s vicebajtovymi znaky. Reseni je to tedy hezke,
> >ale ma to sva "ALE".
> >
>
> Tyka se to i UTF-16?
Multi-byte kodovani je vice: EUC-JP, EUC-KR, ISO 2022-JP, Shift-JIS, Big5, UHC, UTF-*
Dobre ctivo je napr.: http://www.debian.org/doc/manuals/intro-i18n/
Nemyslim vsak, ze by UTF znamenalo penalizaci vykonu pokud prostredi
je plne unicodove a neni nutne prekodovavat. Porovnat dva UTF retezce
je stejne jako porovnat jakekoliv jine retezce. Co je jine jsou veci
ktere jsou v cecku v <ctype.h> (klasifikace jednotlivych znaku -
mala/velka pismena apod.) a pak snad jeste hledani znaku v retezci,
ktere pokud je hledanym znakem multibyte znak se stava hledanim
podretezce v retezci. To je vse. Tedy v solidne napsanem systemu
pokud nepouzivate veci jako ignorovani velikosti pismen a mixovani
ruznych kodovani by mel byt vykon podobny -- mozna budete myt trosku
plnejsi pamet :-)
BTW, to mixovani kodovani a nutnost prekodovavat je naprosto bezne pokud
napriklad pouzivate GTK-2.x v systemu s Latin2 locale (muj debian :-). Z
tohoto pohledu je RH8 mozna naopak cesta k vetsi efektivite a vykonu.
Karel
--
Karel Zak <zakkr na zf.jcu.cz>
http://home.zf.jcu.cz/~zakkr/
Další informace o konferenci Linux