Jak kodovani vybrat pro databazi?

Honza Pazdziora adelton na fi.muni.cz
Středa Březen 29 10:19:32 CEST 2000


On 29 Mar 2000 00:34:32 +0200, Petr Snajdr <snajdr na firma.seznam.cz> wrote:
> 
> Unicode vypada nejlip, ale asi to znamena mit o neco vice pameti,

S tou pameti to nebude tak hrozne. V Oraclu totiz, pokud mate databazi
v UTF-8 (nebo obecne v nejakem kodovani s nekonstantni sirkou znaku),
tak stejne kdyz reknete varchar2(80), tak je to 80 bajtu, nikoli 80
UTF-8 znaku. Vysledkem je, ze pokud tam narvete samou diakritiku, tak
se jich tam vejde polovina.

Coz muzete a nemusite chtit, protoze pak budete importovat data zvenku
nebo slibite uzivateli ve web formulari, ze muze pouzit 80 znaku,
a ono se mu to orizne na 65. Mozna problem. Ale pamet tohle nezabira.
Trideni se dela pres Unicode vzdy (teda verze jako 8 a tak).

Domnivam se, ze uplne nejrozumnejsi je zkombinovat varchar sloupce
v ISO-8859-2 a nvarchar v UTF-8. A ty nvarchar pouzit na texty a tam,
kde budete potrebovat ty dolni uvozovky a copyright a graves,
a varchar2 na jmena souboru a popisky.

> potrebu jineho kodovani (pokud by nastala) vyresi prezentacni vrstva
> Net8 :)).

Potiz s UTF-8 je (jak bylo napsano i v linux na linux.cz), ze i NN 4.7
UTF-8 rozumne nezobrazi. Cili prekodovavat se to musi. A pokud to
udelam uz pri spojeni do databaze, tak mi to sice udela Oracle sam,
ale stejne ty znaky, kvuli kterym jsem to delal, nedostanu. Pokud 
to budu delat v aplikacni rovine, tak bude vysledek v podstate stejny.

Samozrejme, mohu to pojmout tak, ze data budu mit v UTF-8, ted jeste
dva roky, nez se usadi Mozilla, budu mit nastaveno klientske kodovani
natvrdo ISO-8859-2, a az dozraje doba, tak se pouze zmeni tohle
nastaveni, a budu prvni, ktery bude mit data s dolnimi uvozovkami.

> Chce se mi zvolat: babo rad :-), ale bojim se, aby to nekdo treba
> nevzal osobne. :)). Aktualne jsem nejvice naklonen UTF-8.
> Jaky je Vas nazor?

Hmm, v tech Linuxovych prispevcich to bylo popsano vcelku rozumne --
chce se mi zvolat: to zalezi. ;-)

-- 
------------------------------------------------------------------------
 Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
   .project: Perl, DBI, Oracle, MySQL, auth. WWW servers, MTB, Spain.
------------------------------------------------------------------------


Další informace o konferenci Test