Lynx a cestina :-(

Hynek Med xmedh02 na manes.vse.cz
Čtvrtek Říjen 23 22:50:39 CEST 1997


On 23 Oct 1997, Dzon wrote:

> Ahoj,
> kdyz se pripojim na urcite stranky, rekne mi to:
> text/html;charset=iso-8859-2  D)ownload, or C)ancel

To je moje oblibene tema.. Skoda, ze jsem se jesete nedostal k tomu,
napsat o tom neco pro Czech-howto (uz to slibuju dost dlouho, ja vim -
pdm: zatim se tam muze dat tohle :-). 

Pro lynx 2.7.1 je resenim je nastavit si Display Character set v Options
(klavesa o) na ISO Latin 2.  Spravci to mohou nastavit 
v /usr/[local/]lib/lynx.cfg. (Predkompilovane verze pouzivaji /usr/lib,
ty, ktere si zkompilujete sami pravdepodobne /usr/local/lib.)

Pokud je cestina na neoznacenych strankach (bez META tagu nebo atributu
charset u Content-Type) v ISO-8859-2 (coz je technicky spatne, protoze
neoznacene stranky jsou podle RFC v ISO-8859-1) je treba stisknout klavesu
'@', coz je ekvivalentni prikazove radce -raw nebo nastaveni Raw or CJK
mode v Options. Bohuzel se tato moznost neda ulozit (ukladani v Options se
provadi klavesou '>'), ani nastavit globalne v lynx.cfg, takze je nutne
pouzivat alias lynx='lynx -raw', coz mohou spravci nastavit v /etc/profile
apod.

Dalsi uzitecne nastaveni je preferred document c(H)arset : ISO-8859-2 v
Options, pro administratory v lynx.cfg. Podle tohoto tagu (standardni
HTTP/1.0 Accept-Charset: hlavicka) chytre prekodovace cestny (moduly do
Apache, snad i budouci verze modulu Sprinxu pro Microsoft IIS) poznaji, ze
chcete ISO-8859-2, a poslou vam stranku v nem.

Dalsi doporucene nastaveni je moznost "preffered document lan(G)uage",
opet k dispozici v lynx.cfg, zde se udava vas preferovany jazyk, je vhodne
tam dat cz,en, coz znaci, ze chcete ceske nebo anglicke dokumenty (kdyby
tam bylo jen cz, spravne nakonfigurovane HTTP servery by vam mely
odmitnout poslat jinou jazykovou mutaci dokumentu, nez ceskou). 


Jeste lepsi reseni je ale nainstalovat si aktualni vyvojovou verzi lynxu
(jsou podle mych zkusenosti velmi stabilni) z mirroru www.slcc.edu/lynx,
ktery je na ftp.vse.cz/pub/network/lynx-dev/current. Konfigurace a
kompilace je velmi jednoducha, pokud mate slang knihovnu (viz poznamky na
www.cestina.cz), napisete ./configure --with-screen=slang, pokud ncurses
(ty jsou snad ve vsech distribucich linuxu), tak ./configure
--with-screen=ncurses, pokud i tohle selze, tak ./configure. Pak staci dat
make, pockat, a jako root dat make install a pripadne smazat stary lynx z 
/usr/bin/lynx a /usr/lib/lynx.cfg. 

V techto verzich je podpora narodnich abeced opravdu dotazena. Predevsim,
pokud si nastavite spravny Display Character Set, stranky, oznacene META
tagem nebo atributem charest u Content-Type platnou znakovou sadou (i
Windows-1250) se zobrazi spravne. Pro neoznacene stranky je zde moznost
nastavit ^A)ssume charset if unknown v Options (v soucasne dobe klavesa
Ctrl+A), nebo parametru prikazove radky -assume_charset iso-8859-2,
-assume_local_charset iso-8859-2 (tyka se souboru na vasem pocitaci ke
kterym pristupujete pres URL file:..), a -assume_unrec_charset (tyka se
nerozpoznanych znakovych sad). Toto vse je mozne nastavit i v lynx.cfg,
kde je to i bohate komentovane. 

Rovnez je vhodne nastavit Preffered document c(H)arset a preffered
document lan(G)uage, jako u starych lynxu.

Pro uplnost pripojuji, jak vypada moje Options obrazovka:

              Options Menu (Lynx Version 2.7.1ac-0.87)

     E)ditor                      : joe
     D)ISPLAY variable            : NONE
     mu(L)ti-bookmarks: OFF       B)ookmark file: lynx_bookmarks.html
     F)TP sort criteria           : By Filename
     P)ersonal mail address       : xmedh02 na vse.cz
     S)earching type              : CASE INSENSITIVE
     preferred document lan(G)uage: cz,en
     preferred document c(H)arset : ISO-8859-2
     ^A)ssume charset if unknown  : iso-8859-2
     display (C)haracter set      : ISO Latin 2
     Raw 8-bit or CJK m(O)de      : ON      show color (&)  : OFF
     V)I keys: OFF    e(M)acs keys: OFF     sho(W) dot files: OFF
     popups for selec(T) fields   : ON      show cursor (@) : OFF
     K)eypad mode                 : Numbers act as arrows
     li(N)e edit style            : Default Binding
     l(I)st directory style       : Mixed style
     U)ser mode                   : Advanced
     user (A)gent                 : Lynx/2.7.1ac-0.87 libwww-FM/2.14

Mimochodem, pokud vetsina neoznacenych stranek, ktere si prohlizite, je ve
Windows-1250, neni problem nastavit si Assume charset na Windows-1250, a
rovnez i Preffered charset na Windows-1250. 

Hynek

--
Hynek Med, xmedh02 na manes.vse.cz




Další informace o konferenci Linux