Adaptec 2820 - HW RAID? SW RAID? SMART?

Mašek Radek Radek.Masek na o2services.cz
Sobota Září 22 12:45:05 CEST 2007


> Raid se může rozpadnout i bez "úplného kolapsu" disku. V případě
> softwarového raidu dokážu přesně zjistit, jak se pole rozpadalo (jednak
> zprávy automaticky posílané díky monitorování mdadm, dále pomocí
> mdadm --examine). S touto znalostí jej mohu jednoduše znovu složit a
> stáhnout co se dá. Když při stahování narazím na chybné sektory a raid
> se
> znovu rozpadne, jednoduše jej znovu složím, složku či soubor přeskočím
> a
> vesele stahuji dále. Když pak kupříkladu vím, že mezi výpadkem druhého
> a
> třetího disku z raid6 byly dvě minuty a době malého zatížení zápisy,
> tak
> vím, že k sestavení degradovaného pole mohu použít buď poslední vypadlý
> disk, nebo předposlední a v obou případech získat celkem použitelný
> výsledek. Posledně jsem díky tomu zachránil zhruba 1.3 TiB dat
> 
> U hardwarového raidu se při takovém rozpadu raidu (dva a více disků z
> raid5, tři a více z raid6) může snadno stát, že řadič napíše "žádné
> pole
> tu není". A basta - sbohem data. Šance, že bych pole znovu sestavil
> neexistuje. Úvaha, že při novém vytvoření stejně definovaného pole bude
> stejné rozložení dat, a že se tak budu moci dostat své nuly a jedničky
> ztroskotá hned na začátku, protože na hardwarovém raidu nevytvořím raid
> v
> degradovaném režimu. Posledně jsem díky tomu přišel o zhruba 1 TiB dat.
> A
> vlastně jen kvůli tomu, že s hardwarovým raidem nemám dostatečně silné
> nástroje. Jak se totiž v následném 1/2 roku trvajícím řešení problému
> ze
> strany dodavatele hardware ukázalo, všechny disky byly v pořádku. A
> dokonce jsme se dopracovali do takového stavu, že jsme kolaps pole
> dokázali demonstrovat prakticky na počkání. Největší úspěch bylo, když
> při jedné takové demonstraci řadič vyřadil šest disků ze šesti.
> 
> Odtud tedy má nevraživost k hardwarovým raid. Data svých uživatelů a
> zákazníků si cením nakolik, že je nehodlám "vyhazovat" jejich
> umisťováním
> na hardwarový raid. Nezávislostí na konkrétním hardware (včetně
> sledování
> stavu pole) a větší sílou nástrojů u mně naprosto jednoznačně vítězí
> softwarový raid.
> 
> Jednou jsem dokonce měl takovou "třešničku na dortu", když jsem díky
> nalezeným informacím o algoritmu používaným konkrétním hardwarovým
> raidem
> a experimentálně zjištěným parametrům, se kterými byl raid vytvářen,
> data
> z rozpadlého hadrwarového raidu (opět ten případ, kdy řadič hlásil, že
> žádné pole neexistuje) zachránil pomocí linuxového softwarového raidu.
> 
> Slávek

Vyčerpávající popis Vašich zkušeností s mdadm. Každopádně mám pocit, že si
každý pod pojmem HW RAID představujeme něco úplně jiného. 

BTW jestli jste Vám stalo že Vám odešly 2 disky v RAID5, případně 3 disky v
RAID6 .. jste velký smolař nebo jste něco zanedbal ...

Radek Mašek
IT Specialist
 
Telefónica O2 Services, spol. s r.o.
e: radek.masek na o2services.cz 
w: www.o2services.cz, www.itil.cz



Další informace o konferenci Linux