Vypadky disku (ale SMART je OK)

Jan Kasprzak kas na fi.muni.cz
Pátek Prosinec 1 11:30:26 CET 2006


	Zdravim,

mam takovy problem, se kterym uz si fakt nevim rady, tak zkousim brainstorming
v konferenci, treba vas neco napadne: Jde o to, ze mi cas od casu prestane
odpovidat nejaky disk, aniz by hlasil nejakou SMART chybu, a po resetu se
tvari, jako by se nic nestalo. Podrobnejsi informace:

Stroj na kterem bezi tato konference dostal asi pred pul rokem nove disky
a radic - drivejsi konfigurace byla

3ware 7508 (8x P-ATA)
8x WD2500JB (250 GB)

nova konfigurace je

3ware 9550SX-8LP (8x SATA-II)
8x Hitachi 7K500 (500 GB)

krome teto zmeny je na HW urovni vse pri starem. Vcetne treba zdroje
a jeho konektoru, zakladni desky, vetraku, ...

Problem je, ze vzdycky po nejake dobe (tyden az dva) prestane nektery
disk odpovidat (radic se tvari jako by tam vubec nebyl). Kdyz ale stroj
zresetuju, tak se zase disky tvari OK. Pritom ve SMART informacich
zadneho disku neni zaznam o nejake fyzicke chybe, realokovanem sektoru,
selhavsim self-testu, nic takoveho.

No a doba vypadku co tyden az dva je pro me fakt neunosna, protoze po vypadku
je treba synchronizovat hlavni RAID-5 oblast (pres 3TB), coz trva tak tri dny,
a po tu doby je jednak FTP server pomalejsi, a jednak vyrazne vzroste latence
disku, takze nestiha rozposilavat zpravy z konference (ten druhy problem jsem
ted castecne vyresil vhodnou upravou nastaveni delky front a TCQ, a taky
presunem /var na 4x prokladanou RAID-10 oblast).

Zkusil jsem vymenit SATA kabely, ale zda se ze to nepomohlo. Podezrival
jsem zdroj, ale to asi taky neni problem - zjistil jsem dokonce, ze
nove disky maji oproti puvodnim o par mA nizsi prikon (jak bezny, tak i
spickovy).

Pocitac je v klimatizovane serverovne, teploty disku se pohybuji okolo
37 stupnu.

Radic ma posledni firmware, dotaz na support 3ware nevedl k zadnym
rozumnym vystupum.

	Mate nejake napady? Diky,

-Y.

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/    Journal: http://www.fi.muni.cz/~kas/blog/ |
> I will never go to meetings again because I think  face to face meetings <
> are the biggest waste of time you can ever have.        --Linus Torvalds <


Další informace o konferenci Linux