Jak kodovani vybrat pro databazi?

Petr Snajdr snajdr na firma.seznam.cz
Úterý Březen 28 23:52:47 CEST 2000


Dobry den,
   rad bych navazal na otazku, kterou jsem polozil v konferenci o Linuxu 
s tim, ze jsem byl nasledne odkazan sem :-)

Vec je velice jednoducha: clovek v praxi narazi na radku
kodovani. Tu se pouziva CP1250, tu ISO-8859-2 a tu
neco jineho.Otazka je stejne tak jednoducha:

Ktere kodovani si vybrat?

Napohled se i odpoved zda jednoducha:

ISO-8859-2

Jenze je tu nekolik ale. Predevsim nektere znaky
CP1250 v ISO-8859-2 nejsou. Napadaji
me dolni (?) uvozovky a mozna by se jeste neco naslo
(nevim jak jsou na tom treba tvrde mezery, pragraf apod.).
To uz vypada jako realny problem.

Nabizi se tedy jina moznost: CP1250. Znaky tam jsou vsechny,
je fak, ze MIME zrovna toto kodovani nepreferuje, ale
co. Priznam se, ze se CP1250 vsak moc nezamlouva
a navic se situace nekdy muze opakovat (namet
na zamysleni - o s dvema teckami na hore apod.,
mozna to tam je, ale ono by se uz neco naslo).

Dalsi moznosti je UNICODE. Prvi vec kterou 
jsem, zjistil, ze mam pekny chaos v nazvoslovi.
UTF-8, UTF-16, UCS-4,UTF-32 apod. No dobra.
Kazdopadne takhle by teoreticky slo pojmout 
kdejaky znak.

Dalsi dulezita vec je databaze.Samozrejme, ze by dane kodovani
mela podporovat (treba u toho Unicode asi primhourit oko nepujde 
a ani bych to nechtel). To vsak neni problem diky tomu, ze databazi je 
Oracle. Podporuje vsechna kodovani, ktera me aktualne napadaji
jako mozni kandidati a tak zde problem nebude. Kdyz budu chtit
tak si muzu jako kodovani vybrat treba EBCDIC :-) (to byl
pokus o vtip, ale podporovano to je)

Takze jak volit a neprohloupit :-)

Unicode vypada nejlip, ale asi to znamena mit o neco vice pameti,
potrebu jineho kodovani (pokud by nastala) vyresi prezentacni vrstva
Net8 :)).

Jeste dodam odkazy na archiv v Linuxove konferenci:
http://odysseus.linux.cz/cgi-bin/showmsg.cgi?list=linux&id=71635
http://odysseus.linux.cz/cgi-bin/showmsg.cgi?list=linux&id=71637
http://odysseus.linux.cz/cgi-bin/showmsg.cgi?list=linux&id=71713

Chce se mi zvolat: babo rad :-), ale bojim se, aby to nekdo treba
nevzal osobne. :)). Aktualne jsem nejvice naklonen UTF-8.
Jaky je Vas nazor?

S pozdravem
    Petr Snajdr




 




















Další informace o konferenci Databases