Zatuhnutí stroje

Veros Kaplan veros-XXXX na tac.cz
Sobota Únor 7 11:30:16 CET 2004


Dobrý den,

  volal mi kolega, že nefungoval jeden server, který mám na starosti.
Symptomy:  
   - routoval, firewalloval
   - neposkytoval aplikace (DHCP, WWW)
   - zuřivě blikal disk
   - nereagovala konzola (lokální)

   - po restartu je vše OK, v logu jsem nic nenašel
   
  Symptomy odpovídají tomu, že došla paměť a nastal trashing (či hezky
česky výprask), tj.situace, kdy není k dispozici žádná paměť a zuřivě se
honí stránky do swapu a zpátky.

  Jádro podle mne funguje, protože má k dispozici vlastní paměť - i když
zase tam je stavový firewall, který nějakou paměť taky sežere, ten by
měl ztrácet spojení.     Hádám dobře?


  Stroj je IMHO docela silný - 2xXeon, 800MB RAM, samé SCSI disky, takže
se mi zdá nepravděpodobné, že by se paměť přeplnila.
  V náplni práce nemá zatím nic: DHCP pro středně velkou síť (okolo 200
počítačů), DNS, málo zatížený web (20 tisíc přístupů denně, zejména
statické stránky)).

  Nasadím tam monitorování počtu procesů, obsazené paměti a CPU load. Hodí se
monitorovat ještě něco dalšího?

Věroš Kaplan
--
Věroš Kaplan <veros @ tac . cz>
system disaster 
Tacoma Computers, Staňkova 18a, Brno, CZ                http://www.tac.cz/
--
 Názory v tomto mailu uvedené jsou moje vlastní a nemusí se shodovat 
 s názory mého zaměstnavatele.
--
"PCMCIA = People Can't Memorize Computer Industry Acronyms"


Další informace o konferenci Linux