Automaticke odpojeni vadneho disku ze sw RAID1

Michal Dobes dobes na tes.eu
Středa Únor 13 21:19:19 CET 2008


Dalibor Straka napsal(a):
>> Nevite, neexistuje nejake jemnejsi reseni, ktere by umoznilo po jiste serii
>> neuspesnych pokusu o zapis ten disk z mirroru automaticky odpojit ? 
>>  
> Pridavam se z dotazem, podle ceho system vyhodnocuje zda-li disk odpoji?

SW RAID driver to dělá na základě hlášení o read/write chybě bloku
dat od driveru blokového zařízení na kterém je to SW RAID pole
vytvořeno. Pokud to ten driver korektně nenahlásí, tak je RAID
vrstva v klidu a zaděláno na problém.
Mám takovou špatnou zkušenost v několika případech u SATA řadičů,
kdy došlo k úplnému kleknutí disku a neodpovídal, SATA driver
se snažil disk donekonečna dotazovat, házel timeout hlody do logu,
ale zůstal bloknutý a nevrátil v rozumně krátké době chybu a tak
na tom SW RAID jako celek vytuhnul a stroj stál.
Podobné se může přihodí i v případě, kdy je SW RAID tvořen třeba
ze vzdáleného iSCSI disku a nenastaví se korektně timeouty iSCSI
vrstvě a zůstane defaultní nekonečné opakování pokusu.

M.




Další informace o konferenci Linux