postgresql+win1250 + java(tomcat)

Středa Únor 4 09:52:46 CET 2004

On Wed, Feb 04, 2004 at 07:29:59AM +0100, "Zíka Aleš, Ing." wrote:
> > 
> >  Kdyz klient pouziva UTF tak to nejak sdelte PostgreSQL a on bude data
> >  cekavat v UTF a i vam je vracet v UTF. viz:
> > 
> >     SET CLIENT_ENCODING TO 'UNICODE'
> > 
> > 
> 	A nemelo by tam byt spis SET CLIENT_ENCODING TO 'UTF8'? Mam dojem,
> ze UNICODE a UTF je trochu rozdil, UNICODE koduje vsechny znaky do 2 bytu,
> UTF spodek ASCII do jednoho bytu a vrsek do 2 az 4 bytu, takze na textech
> bez narodnich znaku usetri misto.
> 	Ale JAVA snad pouziva plne UNICODE, tak by to snad mohlo chodit cele
> rovnou v nem.

 Sam jsem to tam psal:

 { "unicode", PG_UTF8 },        /* alias for UTF-8 */
 { "utf8", PG_UTF8 },           /* UTF-8; RFC2279 */

 takze v PostgreSQL to alias.

 K tem jmenum, existuje UCS (ISO 10646) a Unicode, do rozpletavani vztahu UCS a 
 Unicodu bych  se nepoustel...  pro silne natury:

    http://www.cl.cam.ac.uk/~mgk25/unicode.html
    cast "What different encodings are there?"

 a neco malo v "man 7 utf-8"

 Unicode je standard zastresujici UTF-7, UTF-8, UTF-16, UTF-16LE,
 UTF-16BE a UTF-32.

 Takze samotne  "Unicode" je  nic, ale  vzhledem k  tomu ze  uchytilo na
 beznou praci UTF-8 (ktere je ASCII kompatibilni) tak se obavam to je de
 fakto alias.

 To co jste nazval Unicodem (na vse dva byte) je ve skutecnosti UCS-2.

    Karel

-- 
 Karel Zak  <zakkr na zf.jcu.cz>
 http://home.zf.jcu.cz/~zakkr/