Jak zatizit server - dlouhodobe testovani stability

Dalibor Straka dast na panelnet.cz
Úterý Leden 16 17:09:14 CET 2007


On Tue, Jan 16, 2007 at 01:51:48PM +0100, Jan Kasprzak wrote:
> David Kredba wrote:
> : Zdravim Vas.
> : 
> : Jaky software na zatizeni serveru se Vam osvedcil?
> : 
> : Mam tu  server, ktery je bez zateze stabilni a pri zatezi se mu obcas po
> : vypnuti a zapnuti degraduje pole a radic pole zrebuilduje.
> : 
> : Deska je Intel, chipset 7230, posledni BIOS, radic Adaptec AAR-2420,
> : posledni firmware, tri disky od ruznych vyrobcu, write caching na discich
> : vypnuty, na radici zapnuty, zalohovano UPS a baterii na radici.
> : 
> : Chtel bych ty rebuildy provokovat co nejcasteji, abych mohl zkouset najit
> : souvislost.
> : V jadre mam prelozeny ovladac od Adaptecu, ne distribucni, protoze s
> : distribucnim byl server jeste mene stabilni.
> : Server bezi na CentOS 4.4, posledni jadro z aktualizaci.
> 
> 	Hmm, nejde tam treba nastavit nejake postupne zapinani disku?
> 
> 	Ja jinak mam svuj software - jednak paralelni kompilace jadra
> (treba 3-5 kopii zdrojaku, v kazdem v cyklu make clean && make -j 4 bzImage
> - podle poctu procesoru a pameti), ten software se diva jestli nektera
> kompilace neskoncila s chybou nebo jestli se neodmlcela na prilis dlouho.
> 
> 	Pak (jako v tvem pripade) kdyz mam spis podezreni na chybu disku,
> tak mam software, ktery zkopiruje velky strom adresaru (treba /usr) nekam
> jinam, a pak bere original a kopii a dela cmp a vypisuje chyby.
> 
> 	No a jeste mam neco jako memtest86, ale v user-space. Naalokuju
> velke pole a delam s nim ruzne kousky - plneni nulama, jednickama, plneni
> daty na preskacku, atd., a pak kontroluju, jestli tam jsou data, ktera tam
> cekam.
> 
> 	Nejvic chyb odhalila kompilace jadra, sem tam neco z toho kopirovani
> souboru, ale ten memtest neodhalil nic (vetsinou rychleji spadla kompilace
> jadra nebo tak neco).
> 
Jinak na debianu existuje primo utilitka "memtester". Chyba vsak nemusi
byt detekovana (pokud se naleza v zaalokovane pameti) a naopak ji odhali
real-mode memtest86.

-- Dalibor Straka


Další informace o konferenci Linux