SMART, disky a kedy je disk naozaj zly

Slavek Banko slavek.banko na axis.cz
Pátek Červenec 30 12:07:43 CEST 2010


Dne pá 30. července 2010 Jan Nemsak napsal(a):
> Ahojte
>
> trochu som zmatany zo smart udajov.
> kedy je disk naozaj zly?
> Ak ked long test vykaze chyby?
> ci staci ked napr.
> atribut  5 Reallocated_Sector_Ct  ma hdnotu >0?
>
> niekde som cital ze je dobre monitorovat atributy  5,  197, 198
> 197 Current_Pending_Sector
> 198 Offline_Uncorrectable
>
> A teraz neviem, lebo napr. 5 Reallocated_Sector_Ct mam >0 aj na disku
> ktory je zly, aj na disku ktory prejde aj cez badblocks aj cez smart
> long test
>
> Neviete mi poradit ako jednoznacne urcit ci je disk zly? Aby som si to
> mohol zahrnut ako monitorovaci script do zabbixu.
>
> Dakujem
>
>
> Jano

5 - Reallocated_Sector_Ct signalizuje, že sektory ošetřil firmware disku, 
takže v pohledu systémy (bacblocks) by to nemělo být poznat. Pokud je 
číslo dlouhodobě malé, tak ještě asi není třeba se výrazně znepokojovat. 
Ale pokud naskakují další a další přemapované sektory, tak bych disk 
raději vyměnil.

Podobně se 197 - Current_Pending_Sector a 198 - Offline_Uncorrectable - 
pokud naskakují další a další sektory, pak raději disk vyměnit. Z těch, 
co jsou ve 197 by se měly postupně stát buď 5 nebo 198. Vyšší číslo v 198 
je asi nejvíce nepříjemné, protože na takové sektory patrně může systém 
opakovaně narazit.

Například u WD RAID Edice se disky s "nehezkými" hodnotami v 5, 198 i 197 
snažíme reklamovat dříve, než si disk postaví hlavu definitivně.

Slávek



Další informace o konferenci Linux