sw RAID a spolehlivost

Petr Simek psimek na jcu.cz
Pondělí Srpen 4 19:17:56 CEST 2008


On Mon, 4 Aug 2008, plocek.martin na centrum.cz wrote:

> Pred casem se mi dostal do rukou jakysi Compaq se dvema SCSI hot-swap
> disky. Nainstaloval jsem na nej distr. Debian Etch a disky jsem dal do
> rezimu RAID 1 (Mirroring). Nad timto RAIDem jsem pak vytvoril pouze
> korenovy oddil (s ext3) a swap.
>
> Po instalaci a naslednem restartu jsem si rekl "tak, a nasimulujeme si
> vypadecek" a jeden ten disk jsem zaziva vytahnul. A najednou mi zmizel
> adresar /usr (resp. zacal se spis tvarit, jako by byl neplatnym
> odkazem) a na terminalu se mi zacali objevovat vselijake takove
> nepekne hlasky. System samotny se nekousl, ale bliz jsem to tehdy
> bohuzel nezkoumal.

Po instalaci to nejakou dobu trva nez se ten RAID zasynchronizuje,
300GB partisna trva hodiny. Jestli jste pred tim vytrhl ten nespravny
disk, tak to holt nefungovalo.

> Ted jsem se ovsem dostal do situace, kdy budu muset RAID 1 naostro
> nasadit a tak se snazim dopatrat pricin toho tehdejsiho nezdaru, ale
> nedari se mi na Internetu najit nic relevantniho.
>
> Chtel bych se tedy zeptat, zda-li mate nekdo s necim podobnym
> zkusenost, prip. kde bych se mohl docist jak presne takovy SW RAID
> vlastne pracuje. Jsou data na oba disky ukladana paralelne nebo se
> musi v urcitych periodach "sesynchronizovat" a ja jsem se zrovna
> trefil mezi ty "periody"? Jinymi slovy, jedna se o bezny jev, nebo to
> mam zkusit znovu nasimulovat a prijit s konkretnimi chyb. hlaskami?

Kdyz na tu RAID partisnu neco zapisete, octne se ve stavu activ (nebo
tak nejak) a kdyz se to dosynchronizuje prejde do stavu clean. Pak je
to synchronni.

Ja jsem s tim delal pokusy nez jsem to nasadil. Kdyz jsem vytrhl 
zasynchronizovany disk tak vse OK. Kdyz jsem ho vratil zpet tak uz
to bylo slabsi - system si porad pamatoval puvodni disk (sda) a ten
znovu zastrceny (na stejne misto) oznacil jako sdc. Takze nasledoval
reboot a pak znovu nahozeni toho vytrzeneho disku do raidu. Coz trva
stejne dlouho jako pocatecni inicializace. Inicializace probiha 
prekopirovanim vsech sektoru, nezalezi tedy na obsazeni daty, na
mnozstvi 'nesynchronizovanych' dat, ale pouze na velikosti partisny.

Nezapomente ze swap musite mit taky na RAIDu protoze rozhodit ho na
dve partisny na dvou discich neni ono - vytrzenim disku prijdete o
kus pameti.

Na tom soft RAIDu mi trochu vadi ta resynchronizace - ze se to dela
vzdy komplet. Na druhou stranu to mate totalne pod kontrolou, coz mi
vyhovuje, a fakticky vzato tahle operace se asi dela jen pri vypadku
disku, coz neni casty jev.

Kdysi jsem delal instalaci novella na HP server s diskovym polem
a RAID radicem - tam to slapalo tak ze jsem vytrhl disk, zapsal data,
zastrcil disk - svetylka se rozsvitily a bylo zasyncronizovano. Vytrhl
jsem jiny disk, zase zapis dat a disk zpet. Nasledovala bleskova
resynchronizace a zase vse OK. Tohle se mi moc libilo. Na druhou stanu
tyhle HW RAIDy mohou mit nevyhodu - kdyz Vam po trech/peti letech odejde
deska a nikde nebudete mit druhou stejnou - date ty data jeste nekdy
dohromady ?

> Martin

*------------------------------------------------------------------------*
|                          Petr Simek   APS JU                           |
|                             psimek na jcu.cz                              |
*------------------------------------------------------------------------*



Další informace o konferenci Linux