Vypadky disku (ale SMART je OK)

Antonín Mička antonin.micka na megasphera.cz
Sobota Prosinec 2 10:51:03 CET 2006


Dne pá 1. prosince 2006 11:30 Jan Kasprzak napsal(a):
> 	Zdravim,
>
> mam takovy problem, se kterym uz si fakt nevim rady, tak zkousim
> brainstorming v konferenci, treba vas neco napadne: Jde o to, ze mi cas od
> casu prestane odpovidat nejaky disk, aniz by hlasil nejakou SMART chybu, a
> po resetu se tvari, jako by se nic nestalo. Podrobnejsi informace:
>
> Stroj na kterem bezi tato konference dostal asi pred pul rokem nove disky
> a radic - drivejsi konfigurace byla
>
> 3ware 7508 (8x P-ATA)
> 8x WD2500JB (250 GB)
>
> nova konfigurace je
>
> 3ware 9550SX-8LP (8x SATA-II)
> 8x Hitachi 7K500 (500 GB)
>
> krome teto zmeny je na HW urovni vse pri starem. Vcetne treba zdroje
> a jeho konektoru, zakladni desky, vetraku, ...
>
> Problem je, ze vzdycky po nejake dobe (tyden az dva) prestane nektery
> disk odpovidat (radic se tvari jako by tam vubec nebyl). Kdyz ale stroj
> zresetuju, tak se zase disky tvari OK. Pritom ve SMART informacich
> zadneho disku neni zaznam o nejake fyzicke chybe, realokovanem sektoru,
> selhavsim self-testu, nic takoveho.
>
> No a doba vypadku co tyden az dva je pro me fakt neunosna, protoze po
> vypadku je treba synchronizovat hlavni RAID-5 oblast (pres 3TB), coz trva
> tak tri dny, a po tu doby je jednak FTP server pomalejsi, a jednak vyrazne
> vzroste latence disku, takze nestiha rozposilavat zpravy z konference (ten
> druhy problem jsem ted castecne vyresil vhodnou upravou nastaveni delky
> front a TCQ, a taky presunem /var na 4x prokladanou RAID-10 oblast).
>
> Zkusil jsem vymenit SATA kabely, ale zda se ze to nepomohlo. Podezrival
> jsem zdroj, ale to asi taky neni problem - zjistil jsem dokonce, ze
> nove disky maji oproti puvodnim o par mA nizsi prikon (jak bezny, tak i
> spickovy).
>
> Pocitac je v klimatizovane serverovne, teploty disku se pohybuji okolo
> 37 stupnu.
>
> Radic ma posledni firmware, dotaz na support 3ware nevedl k zadnym
> rozumnym vystupum.
>
> 	Mate nejake napady? Diky,
>
> -Y.

Zdravím, 

No, bohužel až teď jsem si vzpoměl, že na cdr.cz testovali řadiče, nějaký 
kousky jim opakovaně dělali problémy při osmi discích.
Takže bych se kouknul na ten řadič.

-- 
Antonín Mička


Další informace o konferenci Linux