stabilita linuxu

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Čtvrtek Červenec 26 22:15:20 CEST 2001


On Mon, 23 Jul 2001, Michal Žejdl wrote:

> Příznaky: server běží 11-12 dní a pak zatuhne (stalo se třikrát na třech
> různých jádrech). Jednou jsem zátuh sledoval - příkazy ps, top, w se
> zastavovaly a zvedaly load o 1 (ps než se zastavil vypsal neúplný seznam
> procesů); další příkazy (df, free), služby a úlohy (ASPI, ftp, mrtg,
> ssh) fungovaly bez problémů. Posléze i tyto odumřely (trvalo to tak 20
> minut). Pak už server reaguje jen na ping a SysRq - ovšem Sync ani
> Umount neprovede.

Zajimave. To zrejme znamena, ze se zasekava nejaky zamek, ktery je potreba
k cmuchani v /proc. Nejspis je to zamek na datech nejakeho konkretniho
procesu, ktery je puvodcem celeho problemu.

Tak mne napada, ze by nebylo od veci, kdyby jadro samo poznalo, kdyz je na
nejaky zamek moc dlouha fronta, ktera se nehybe, a samo nabonzovalo, ze
nastal nejaky problem (s prislusnymi detaily).

> Máte někdo nějaký jiný nápad (než změnit jádro a čekat týden a půl) jak
> se dobrat co nejrychleji k stabilnímu serveru?

Pokusit se chyby opravit a ne je obchazet? ;)

--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."



Další informace o konferenci Linux