co kdyz server proste zatuhne a nereaguje?
Martin Lipinsky
martin na lipinsky.cz
Čtvrtek Leden 29 14:57:22 CET 2004
DD.
Kdysi nam jeden server (pravda, levna PC slatanina z komponent) zacal
delat neco podobneho co popisujete. Nastesti to nebylo v US ale v
kancelari, takze jsme vymenili disky a scsi radic do meho stolniho
pocitace a pomalu se testovalo.
Nakonec se ukazalo ze je pravdepodobne neco se sitovkou (bezela v ty
masine 3 roky).
Po jeji vymene a vraceni vseho najednou vse ok, i s puvodnimi disky,
konfiguraci atd.
Druhe divne na tom je, ze ta sitovka pak slapala dalsich X let pod
wokenicema v jakesi sekretarcine workstejsne. Takze byd byl problem jen
spatne zasunuti do slotu nebo neco podobneho (podruhe uz se to do serveru
necpalo, kdyz tak krasne bezel), a nebo mensi zatez ci jine drivery na ten
problem nikdy "nenarazili".
Kazdopadne me nic rozumnejsiho nez sehnat nekde msinu na vymenu a pak ji
podrobit tvrdemu testovani nenapada. Doporucuji mprime (pocitani
prvocisel) a jeho strestest, vecinu z problemu typu
pamet/procesor/motherboard dokaze odhalit radove rychleji nez specialni
detekcni programy.
Priklad:
memtest nasel chybnou pamet az po xtem prubehu za asi 7 hodin,
goldenmemory po 2 hodinach. Prime mi na tom stroji vytuhnul za 2 minuty.
Pravda, nerekl mi kde to je, ale vedel sem ze mam hledat HW problem.
S pozdravem
---------------------------------------------------------[ Martin Lipinsky ]--
Motto: Jak to vis ze je carodejnice ? Protoze tak vypada !
> Dne 28.01.2004 v 16:20 +0100, Michal Kara napsal(a):
> > > > Abych predesel spekulacim: v logach nic neni, load v dobe tesne pred
> > > > smrti byl '0.50 0.32 0.28', apache mel 352 threadu, java 83. Zabrana
> > > > pamet = 1342084 bajtu (1G3). Vic nevim.
> > Bohuzel takovehle zatuhy jsou dost neprijemne a velmi spatne se odhaluji
> > :-( Pripadne muzete zkusit ten server zatizit (cpu_burn, memtest, zurive
> > kopirovani na discich), jestli se vam ho podari shodit.
Další informace o konferenci Linux