postgresql+win1250 + java(tomcat)
Karel Zak
zakkr na zf.jcu.cz
Středa Únor 4 09:52:46 CET 2004
On Wed, Feb 04, 2004 at 07:29:59AM +0100, "Zíka Aleš, Ing." wrote:
> >
> > Kdyz klient pouziva UTF tak to nejak sdelte PostgreSQL a on bude data
> > cekavat v UTF a i vam je vracet v UTF. viz:
> >
> > SET CLIENT_ENCODING TO 'UNICODE'
> >
> >
> A nemelo by tam byt spis SET CLIENT_ENCODING TO 'UTF8'? Mam dojem,
> ze UNICODE a UTF je trochu rozdil, UNICODE koduje vsechny znaky do 2 bytu,
> UTF spodek ASCII do jednoho bytu a vrsek do 2 az 4 bytu, takze na textech
> bez narodnich znaku usetri misto.
> Ale JAVA snad pouziva plne UNICODE, tak by to snad mohlo chodit cele
> rovnou v nem.
Sam jsem to tam psal:
{ "unicode", PG_UTF8 }, /* alias for UTF-8 */
{ "utf8", PG_UTF8 }, /* UTF-8; RFC2279 */
takze v PostgreSQL to alias.
K tem jmenum, existuje UCS (ISO 10646) a Unicode, do rozpletavani vztahu UCS a
Unicodu bych se nepoustel... pro silne natury:
http://www.cl.cam.ac.uk/~mgk25/unicode.html
cast "What different encodings are there?"
a neco malo v "man 7 utf-8"
Unicode je standard zastresujici UTF-7, UTF-8, UTF-16, UTF-16LE,
UTF-16BE a UTF-32.
Takze samotne "Unicode" je nic, ale vzhledem k tomu ze uchytilo na
beznou praci UTF-8 (ktere je ASCII kompatibilni) tak se obavam to je de
fakto alias.
To co jste nazval Unicodem (na vse dva byte) je ve skutecnosti UCS-2.
Karel
--
Karel Zak <zakkr na zf.jcu.cz>
http://home.zf.jcu.cz/~zakkr/
Další informace o konferenci Test