UTF-8 [Was: Sendmail remote root]

Milan Kerslager milan.kerslager na pslib.cz
Neděle Březen 9 20:15:55 CET 2003


On Sun, Mar 09, 2003 at 03:40:34PM +0000, Stanislav Meduna wrote:
> On Sun, 9 Mar 2003 14:34:17 +0000 (UTC), Milan Kerslager wrote:
> 
> : set send_charset = "us-ascii:iso-8859-1:iso-8859-2:utf-8"
> : 
> : Takže se dopis pošle tak, jak to "jde", takže pokud použiju dlouhé í a
> : dlouhé á, tak to odejde v 8859-1, jinak 8859-2 a když do toho vrznu
> : nějaký ten hieroglif nebo čínský obrázek, tak pak teprve UTF-8.
> 
> A ak v tom vi-cku nadatlujem nieco, co je aj v 8859-1, aj -2,
> ale ide o ine pismeno, tak ma kristalovu gulu a vyberie si
> ten spravny header, nie? :-/ To nie je hypoteticky priklad,
> ja celkom bezne pisem z jedneho stroja anglicky, slovensky
> a nemecky. Aj preto casto volim cestu mensieho odporu
> a pisem bez diakritiky.

Kdyz mam odesilat neco v UTF-8, nebudu vkladat text v kodovani, ktere je
subsetem, ale rovnou v UTF-8. Pak je mozne prekodovat do subsetu (ASCII,
8859-1 nebo 8859-2 podle toho, co jsem tam nacpal za znaky). Obracene to
smysl nema a ViM IMHO nepodporuje text z pulky napsany v 8859-1 a z
pulky v 8859-? (a je zejmena dnes je to celkem zbytecna vlastnost).

Zminena volba send_charset funguje tak, ze zkusi prevest text do prvniho
kodovani v seznamu a kdyz to nepujde, zkusi dalsi atd. Tim splnim prani
ASCII-like systemu, protoze tento dopis (napsany bez hacku) odejde s
vyplnenym kodovanim ASCII (takze mi staci psat takhle blbe, aby to
precetl kazdy a staci zacit psat hacky, aby to odeslo inteligentneji).

> UTF bude bezproblemove, az sa v nom budu texty nielen
> zobrazovat, ale predovsetkym pisat. Trufam si tvrdit,
> ze takych strojov je zatial skutocne mensina.

Ja pisu jen v UTF-8. A pokud pozijes na cteni prumerne inteligentni
program, prectes to (kdyz nebudu pouzivat znaky, na ktere nemas 8859-?
fonty). Dokonce to prectes i ve Windows, kde je UTF-16 (subset UTF-8),
coz lze nejsnadneji predvest v MSIE nebo Mozille (kombinace latinky,
azbuky a cinskych obrazku napr. take hned na prvni strance instalatoru
RH [ve vyberu jazyku]).

> : Kdyby se všichni měli řídit Vaším názorem, používali bychom všichni
> : ASCII ještě za 100 let (což jistě není ani ve Vašem zájmu).
> 
> No, ja by som zrusil vsetky narodne jazyky a abecedy
> a zaviedol by som po celom svete anglictinu. Na zaciatku
> by to bol dost zmatok, ale za tych 100 rokov by sme
> vsetci pouzivali ASCII a bolo by po probleme :-)))

Rekl bych, ze ne. Uz dneska ma Anglictina dialekty a zaruka znalosti
Queen English (to co se ucime ve skole) neni zarucena. Takze ASCII
mozna, ale hladkemu dorozumeni to nemusi pomoci (dialekty, mistni vyrazy
atp).

A navic by se musely exoticke texty sazet porad extra a porad bysme
dokola opravovali programy pracujici korektne s 8859-1, ale nepracujici
v 8859-[^1] (i kdyz treba jen kvuli minoritnim textum a historickym
pojednanim).

-- 
                        Milan Kerslager
                        E-mail: milan.kerslager na pslib.cz
                        WWW:    http://www.pslib.cz/~kerslage/


Další informace o konferenci Linux