jak ziskat charset z LC_CTYPE?

Cejka Rudolf cejkar na dcse.fee.vutbr.cz
Středa Červenec 18 15:43:56 CEST 2001


Jan Kasprzak <kas na informatics.muni.cz> wrote:
>         Ja vim. Ale to uz se asi nejak zvladne (napriklad prevest na
> lowercase a vypustit vsechny pomlcky krome prvni?)

Preji prijemnou hackerinu :-)

* Na velikosti pismen moc nezalezi, nebo ano?

* Pomlcky - no, radsi bych to udelal obracene, tj. je-li v retezci vice
  pomlcek, vypustim vsechny krome posledni.

* Jeste podtrzitka - pokud se vrati treba ISO_8859-2, tak prevest
  na ISO8859-2. Tj. asi zrusit podtrzitka.

K tomu kodovani:

* Stare aplikace pred nl_langinfo() mely koukat na priponu v LC_CTYPE,
  tj. z cs_CZ.ISO8859-2 si muzou vytahnout kodovani ISO8859-2. Tj. kdo
  si mysli, ze je zbytecne pouzivat cs_CZ.ISO8859-2 a lepsi je cs_CZ,
  a ze systemy, ktere nemaji implementovane (nekdy tak trochu umyslne)
  vselijake ty aliasy cs_CZ a czech a dalsi ruzne novinky, ze jsou
  horsi - no, je to tema na peknou diskusi, ktery system co kdy pokazil.

* U novych aplikaci lze ocekavat rovnou volani nl_langinfo().

Co jsem tak videl, tak Solaris a FreeBSD-po-prechodu se tvari, ze
konverze pro ISO nutne nejsou, FreeBSD-pred-prechodem tam ma navic
ta podtrzitka (holt to je tak, kdyz spolu nejdou skloubit ruzne
normy a specifikace a historicke chovani) a Linux tam ma navic ty
pomlcky. Vsechna ta KOI, EUC atd. jsem radsi ani nezkousel...

Ja bych to videl neco jako autoconf. Zacne se na jednom systemu a neco
se nejak udela a pak se pridavaji dalsi systemy a postupne se pridavaji
jednotlive konverze. S puvodni filozofii prenositelnosti to uz sice
nema nic spolecneho, ale to uz dneska stejne nikoho moc nezajima.
Podstatnejsi preci je, ze to v XXX funguje a v YYY ne (= vetsinou jo, ale
je to holt trochu jinak) a tak muzeme radostne prohlasit, ze YYY je horsi.
Pro reklamu skvela vec. Ono stejne, kdyz se clovek z nejake normy dozvi,
ze ISO-8859-2 je vlastne ISO-IR-101, ISO_8859-2:1987, ISO_8859-2, LATIN2
nebo L2, ale uz se nedozvi tvar, ktery se pouziva v X Window, tak si moc
velke iluze o dokonalosti a sanci na uspech nedelam.

-- 
Rudolf Cejka   (cejkar na dcse.fee.vutbr.cz;  http://www.fee.vutbr.cz/~cejkar)
Brno University of Technology, Faculty of El. Engineering and Comp. Science
Bozetechova 2, 612 66  Brno, Czech Republic


Další informace o konferenci Linux