mblen a dalsi multibyte funkce

Pavel Kankovsky peak na kerberos.troja.mff.cuni.cz
Úterý Červen 16 16:44:20 CEST 1998


On Tue, 16 Jun 1998, Zdenek Kabelac wrote:

> Mam takovy problem, potreboval bych nejak pouzivat multibyte
> kodovani, ale neni mi jasne podle ceho a jak to lze vubec
> v linux-u s glibc2.1 pouzivat.
[...]

pouzite kodovani se jmenuje UTF8

urcite nekde existuje lepsi popis, jak to funguje, ale zkusim dat aspon
nekolik prikladu (hodnoty jsou binarne, ve [] jsou dodatecne kodovaci
informace, vse samozrejme bez zaruky): 

wc            mb
100010        00100010
11001010      [101]00110  [10]001010
1011110111111 [1110]0001  [10]011110  [10]111111

delka mb je primo umerna hodnote wc: wc < 2^8 ma jeden bajt, wc < 2^11 ma
dva bajty, wc < 2^16 ma tri bajty, wc < 2^21 ma ctyri bajty a vetsi (az do
2^31) maji pet bajtu

--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"You can't be truly paranoid unless you're sure they have already got you."



Další informace o konferenci Linux