Zrcadleni disku po LAN v realnem case

Čtvrtek Únor 7 12:44:11 CET 2008

Michal Dobes napsal(a):
> 1) myslím, že bez initrd toho nedosáhnete.
> 2) požadovaného stavu nedosáhnete jen jedním produktem současně, každý
> plní jinou roli.
> 3) požadovaného výsledku jde dosáhnout třeba i pomocí toho DRBD, ale jen
> pokud současně použijete třeba ten GFS.

Myslím, že je vhodné zmínit ještě pár problému k dostatečnému
vyděšení spojené se spolehlivým uchozením toho řešení.

I když uchodíte ty tři body, tak se bude třeba zamyslet nad
spolehlivostí a jak se to bude chovat při výpadku. Krom jiného,
budete muset třeba při použití toho Redhatího GFS na všech těch
uzlech mít nainstalován i jejich clusterový suite a mít ho v provozu,
protože ho GFS používá pro distribuované zamykání přístupu jednotlivých
uzlů (jiné FS to můžou mít řešeno i jinak, je to otázka celkové
spolehlivosti a případně výkonu).
Takže se připravte i na řešení problematiky distribuovaného clusteru,
což je hodně nechutná záležitost. Sice jste neuvedl účel a použití
celého toho řešení, ale počítejte, že to bude jako celek funkční
jen při výpadku jednoho uzlu, ostatní dva musí být v provozu a slyšet
se, pokud se rozpadne komunikace mezi všemi třemi, tak se vám to celé
zastaví, to je problém split-brain, systém jako celek se musí bránit
proti tomu, aby se komunikace rozpadla a jednotlivé uzly si myslely,
že jsou jediní funkční a zprznilo se vše, co jde. Takže je podmínka,
že se musí slyšet většina vzájemně, tak běží dál, pokud tvořím menšinu,
tak se odstavím.
V případě použití clusteru jen se dvěma uzly je problém stejný,
akorát při selhání jednoho uzlu většina neexistuje, proto se
řeší dalšími pomocnými postupy a jejich nasazení v distribuovaném
clusteru je mnohem rizikovější než když je vše v jednom racku.
Takže pro spolehlivé použití také počítejte s řešením STONITH,
což v podstatě znamená, že když přeživší zbytek musí mít nějakým
způsobem umožněno spolehlivě zajistit, že ta část, která se považuje
za nefunkční, aby opravdu nefungovala. Nejbezpečnějším způsobem je
dálkově řešené ovládání napájení a zkrátka se tomu cukne elektrikou.
Jsou i citlivější metody řešení na základě vylučovacích softwarových
zámků a podobných, ale opět si tím zvyšuji trošku riziko, že se to
celé složí. A je to zvláště rizikové nad DRBD a podobnými softwarovými
RAID variantami.

A až tohle vše se pěkně uchodí, tak se bude třeba podívat i na aplikační
vrstu a promyslet, jak to bude fungovat, když fakt ten / bude pro
všechny stejný, tohle už nastínili kolegové. :-)

Obvyklé řešení u těchto systémů bývá, že mají lokální nějaký RAID1,
z kterého jede systém a jen datové disky se připojují jako sdílené.

Tak, můžu spokojeně jít na gáblík. :-)
M.