Vzajmene zdileni vice disku na vice pocitacich

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Pondělí Prosinec 25 01:53:02 CET 2006


On Tue, 19 Dec 2006, Jiri Kosina wrote:

> NBD nesplnuje zadani, protoze neni mozne na takto sdileny disk zapisovat
> z vice klientu soucasne.

Ale kdepak, na *disk* se dá zapisovat zcela bez potíží.
Problém vzniká se zápisem do souborového systému na tom disku! ;)
(A v menší míře do RAIDu, viz níže.)

> Ano, clusterove filesystemy jako GFS nebo OCFS2 (pozor, OCFS2 (je soucasti 
> kernelu) je neco dost jineho nez OCFS) by Vam mely pomoci.

Ve skutečnosti by asi zadání splňovalo to, kdyby se
1. ze zůčastněných fyzických disků vybudovalo pomocí NBD jedno globální
   diskové pole,
2. nad tím diskovým polem se na všech počítačích postavil sw RAID1 (*),
3. nad tím RAIDem se provozoval nějaký clusterový FS.

(*) RAID1 (a kombinace jako RAID10, RAID0+1 atd...) by měl fungovat. Sice
by mohla vzniknout nekonzistence tím, kdyby na jedno místo zapisovalo víc
účastníků a každý zvolil jiné pořadí zápisů na jednotlivé komponenty
RAIDu, ale pokud na tím poběží clusterový FS, tak ten by měl současný
zápis do jednoho bloku vyloučit. RAID5 by už asi nevyhnutně vyžadoval
speciální clusterovou implementaci, jelikož je třeba koordinovat
aktualizaci paritních bloků. V obou případech také vzniká problém při 
výpadku jednoho uzlu uprostřed zápisové operace, ovšem se ten se pro RAID1 
na 2 discích elegatně vyřeší sám tím, když s uzlem vypadne i jeho disk a 
RAID přejde do degradovaného ale konzistentního módu.

Jinak na "síťový" RAID přes lokální disky uzlů clusteru je DDRaid
<http://sources.redhat.com/cluster/ddraid/> a explicitně to tam doporučují 
kombinovat s clusterovým FS. Akorát je to asi ještě trochu nedovařené.

--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."



Další informace o konferenci Linux