Adaptec 2820 - HW RAID? SW RAID? SMART?

Slávek Banko slavek.banko na axis.cz
Sobota Září 22 01:51:58 CEST 2007


Raid se může rozpadnout i bez "úplného kolapsu" disku. V případě 
softwarového raidu dokážu přesně zjistit, jak se pole rozpadalo (jednak 
zprávy automaticky posílané díky monitorování mdadm, dále pomocí 
mdadm --examine). S touto znalostí jej mohu jednoduše znovu složit a 
stáhnout co se dá. Když při stahování narazím na chybné sektory a raid se 
znovu rozpadne, jednoduše jej znovu složím, složku či soubor přeskočím a 
vesele stahuji dále. Když pak kupříkladu vím, že mezi výpadkem druhého a 
třetího disku z raid6 byly dvě minuty a době malého zatížení zápisy, tak 
vím, že k sestavení degradovaného pole mohu použít buď poslední vypadlý 
disk, nebo předposlední a v obou případech získat celkem použitelný 
výsledek. Posledně jsem díky tomu zachránil zhruba 1.3 TiB dat.

U hardwarového raidu se při takovém rozpadu raidu (dva a více disků z 
raid5, tři a více z raid6) může snadno stát, že řadič napíše "žádné pole 
tu není". A basta - sbohem data. Šance, že bych pole znovu sestavil 
neexistuje. Úvaha, že při novém vytvoření stejně definovaného pole bude 
stejné rozložení dat, a že se tak budu moci dostat své nuly a jedničky 
ztroskotá hned na začátku, protože na hardwarovém raidu nevytvořím raid v 
degradovaném režimu. Posledně jsem díky tomu přišel o zhruba 1 TiB dat. A 
vlastně jen kvůli tomu, že s hardwarovým raidem nemám dostatečně silné 
nástroje. Jak se totiž v následném 1/2 roku trvajícím řešení problému ze 
strany dodavatele hardware ukázalo, všechny disky byly v pořádku. A 
dokonce jsme se dopracovali do takového stavu, že jsme kolaps pole 
dokázali demonstrovat prakticky na počkání. Největší úspěch bylo, když 
při jedné takové demonstraci řadič vyřadil šest disků ze šesti.

Odtud tedy má nevraživost k hardwarovým raid. Data svých uživatelů a 
zákazníků si cením nakolik, že je nehodlám "vyhazovat" jejich umisťováním 
na hardwarový raid. Nezávislostí na konkrétním hardware (včetně sledování 
stavu pole) a větší sílou nástrojů u mně naprosto jednoznačně vítězí 
softwarový raid.

Jednou jsem dokonce měl takovou "třešničku na dortu", když jsem díky 
nalezeným informacím o algoritmu používaným konkrétním hardwarovým raidem 
a experimentálně zjištěným parametrům, se kterými byl raid vytvářen, data 
z rozpadlého hadrwarového raidu (opět ten případ, kdy řadič hlásil, že 
žádné pole neexistuje) zachránil pomocí linuxového softwarového raidu.

Už nikdy bych do produkčního prostředí nechtěl jiný raid, než SW RAID 
(mdadm). Hardwarový nanejvýše RAID1, protože u toho vím, co na jakém z 
disků rozpadlého pole hledat :)

Poznámka: O těch cylindrech jsme si rozuměli. Rozdílnost v CHS fyzického a 
logického disku je pro data nepodstatná. CHS je v podstatně nedůležitý 
přežitek. Důležité je jen to, zda si ten hardwarový raid dává informaci 
o "poli" na konec disku, nebo na začátek. Pokud ji dává na konec, jste na 
tom řadiči naprosto nezávislý. S jiným řadičem se z tabulky rozdělení 
disku dozví právě tu "logickou" geometrii, uvidí oddíly a bez komplikací 
softwarový raid sestaví.

Slávek
-- 
Dne pátek 21 září 2007 15:58 Petr Klíma napsal(a):
> Slavek Banko wrote:
> > Můj osobní názor: Ano, zuby nehty se držet osvědčeného SW RAIDu
> > (klidně i za cenu ztráty pár desítek cylindru). Jako jednoznačný
> > důvod pro mně je, že se sw raidem máte v ruce silnější nástroje,
> > které oceníte po fatálním rozpadu pole.
> >
> > A mohu říci, že už jsem si to i několikrát potvrdil praxí...
>
> Ciste ze zvedavosti - ono se da neco pouzitelneho vyhrabat z totalne
> rozpadle RAID5?
>
> Ja mam zatim s HW RAID (5) jenom ty nejlepsi zkusenosti (3ware, Dell
> Perc5).
>
> Tosuja



Další informace o konferenci Linux