IBM SCSI SMART?

Petr Stehlik pstehlik na sophics.cz
Pátek Prosinec 1 22:32:18 CET 2006


Jan Kasprzak píše v Pá 01. 12. 2006 v 11:02 +0100:
> : Background long   Self test in progress ...   -     NOW
> 
> 	No, a jaka je zatez na tech discich

zatez je asi takova nejaka prumerna (odhaduju z toho, ze RAID5
rekonstrukce mela trvat nekolik dni pod zatezi, anebo 2 hodiny pri
nezatezi). Ale vlastne to jsou datove disky, mam tam jeste systemove
disky a ty nedelaji temer nic (krome /var/log), a pritom prubeh testu je
na nich stejny.

> a jak dlouho ten self-test nechate bezet?

treba pul roku, proste ho pustim a on nikdy neskonci. Na vsech 6 discich
mam ted napsane, ze SMART test probiha NOW. Na nekterych je to uz od
jara.

> Mam zkusenosti, ze to co disk vypisuje jako ocekavanou
> dobu trvani self-testu, je jeho optimisticky odhad jak by se choval
> kdyby nebyla zadna zatez.

disk odhadoval, ze long test zmakne za 67 minut. Ale viz vyse, dal jsem
mu casu dost.

> 	Na ftp.linux.cz mam 500GB SATA disky, ktere odhaduji delku trvani
> long self-testu na nejakou pulhodinu, ale realne pri aktualni zatezi
> (cca 50% casu ten disk ma co delat) trva long self test 2-3 dny (z cehoz
> vetsinu to pise, ze uz zbyva jen 10%).

hm, tak to je zajimave, ale ty IBM v tom testu proste vytuhnou, si
myslim.

> : V praxi to znamena, ze vubec nemuzu ty disky testovat pres smartd, takze 
> : o jejich smrti se dozvim az se zpozdenim, az kdyz se odpoji od sbernice, 
> : protoze treba maji necitelne/nezapisovatelne sektory.
> 
> 	Smartd tam prece poustet muzete (na pasivni cteni informaci
> o teplote, relokovanych blocich a fyzickych chybach).

to ano, ale o tom mi zrejme neprijde ten automaticky mail od smartd. Ten
myslim chodi jen pokud se najde nejaka chyba pri testovani.

> Prece fyzicka chyba
> neznamena, ze se disk odpoji od sbernice, nebo u techhle disku ano?

Myslim, ze je to tak. Vsiml jsem si toho mrtveho disku vlastne az z
vypisu logwatche, ktery v kernel logu a syslogu nasel ty hlasky, ze disk
nezapisuje sektory X, ze je vyhozeny z RAIDu a vubec ze stoji za ....
Pritom S.M.A.R.T. mel teto smrti predchazet. Disk odesel v nedeli rano,
teprve v pondeli jsem ho mohl objednat, az ve stredu prisel, pak se dva
dny restaurovalo pole... Celkem peklo. Priste bych chtel byt o blizici
se smrti informovan pokud mozno predem, coz jsem prave sveril tomu
SMARTu. Zatim na vsem discich SMART fungoval normalne, jen na techto IBM
dela NOW. Tak nevim.

Petr




Další informace o konferenci Linux