co kdyz server proste zatuhne a nereaguje?

Martin Lipinsky martin na lipinsky.cz
Čtvrtek Leden 29 14:57:22 CET 2004


DD.

Kdysi nam jeden server (pravda, levna PC slatanina z komponent) zacal
delat neco podobneho co popisujete. Nastesti to nebylo v US ale v
kancelari, takze jsme vymenili disky a scsi radic do meho stolniho
pocitace a pomalu se testovalo.

Nakonec se ukazalo ze je pravdepodobne neco se sitovkou (bezela v ty
masine 3 roky).

Po jeji vymene a vraceni vseho najednou vse ok, i s puvodnimi disky,
konfiguraci atd.

Druhe divne na tom je, ze ta sitovka pak slapala dalsich X let pod
wokenicema v jakesi sekretarcine workstejsne. Takze byd byl problem jen
spatne zasunuti do slotu nebo neco podobneho (podruhe uz se to do serveru
necpalo, kdyz tak krasne bezel), a nebo mensi zatez ci jine drivery na ten
problem nikdy "nenarazili".

Kazdopadne me nic rozumnejsiho nez sehnat nekde msinu na vymenu a pak ji
podrobit tvrdemu testovani nenapada. Doporucuji mprime (pocitani
prvocisel) a jeho strestest, vecinu z problemu typu
pamet/procesor/motherboard dokaze odhalit radove rychleji nez specialni
detekcni programy.

Priklad:

memtest nasel chybnou pamet az po xtem prubehu za asi 7 hodin,
goldenmemory po 2 hodinach. Prime mi na tom stroji vytuhnul za 2 minuty.
Pravda, nerekl mi kde to je, ale vedel sem ze mam hledat HW problem.

S pozdravem

---------------------------------------------------------[ Martin Lipinsky ]--
Motto: Jak to vis ze je carodejnice ? Protoze tak vypada !

> Dne 28.01.2004 v 16:20 +0100, Michal Kara napsal(a):
> > > > Abych predesel spekulacim: v logach nic neni, load v dobe tesne pred
> > > > smrti byl '0.50 0.32 0.28', apache mel 352 threadu, java 83. Zabrana
> > > > pamet = 1342084 bajtu (1G3). Vic nevim.
> >   Bohuzel takovehle zatuhy jsou dost neprijemne a velmi spatne se odhaluji
> > :-( Pripadne muzete zkusit ten server zatizit (cpu_burn, memtest, zurive
> > kopirovani na discich), jestli se vam ho podari shodit.



Další informace o konferenci Linux