high availability (was: Re: RH 6.1 - zklamani - dlouhe)

Robert Dobozy robo na idata.sk
Neděle Říjen 24 22:04:18 CEST 1999


[pozn.: dako som sa rozpisal, tak je to trosku dlhe ...]

Ahoj vsetci,

kedze sa tymito vecami zaoberam a je to tak trosku moja srdcova
zalezitost :-), dovolte mi vniest trosku svetla do tejto problematiky.
V principe pozname dva druhy High availability clustrov:
1. switchover cluster 
2. tzv. True cluster (terminologia Digitalu - Compaqu)

Prvy druh sa vyznacuje tym, ze aspon jeden system je tzv. stand-by, ktory
akoze nic nerobi a caka na poruchu primarneho systemu. Dolezite je ze
aplikacia NEBEZI paralelne.
Pri druhom type sa zklastrovane pocitace tvaria ako jeden system.
Aplikacia teda bezi na dvoch alebo viacerych systemoch paralelne pricom o
tom dokonca ani nemusi vediet! Realizacia takehoto clustera je _velmi_
komplikovana a neviem ci sa v blizkej buducnosti najde niekto kto by to
bol ochotny a schopny realizovat (myslim na Linuxe). V kazdom pripade
musia byt prevadzkychopne vsetky komponenty clustera prveho druhu a potom
sa da na nich postavit true cluster.

Vsetky typy clustrov vyzaduju nejake spojenie a hlavne synchronizaciu dat!
A tu je kamen urazu pod Linuxom. Synchronizacia a spojenie sa v 99%
pripadov robi prostrednictvom zdielanej SCSI zbernice. No a to Linux
zatial nevie.
Problem je v tom, ze potrebujete spojit dva SCSI radice s nejakym
firmware, s nejakymi elektrickymi charakteristikami a nejakymi ovladacmi.
Aby toho nebolo malo, este sa nam tam povaluju take zariadenia ako disky,
pasky a tak. Nastavaju problemy s komunikaciou medzi tymito zariadeniami s
elektrickou nekompatibilitou a podobne. Samozrejme daju sa najst
zariadenia, ktore spolu tieto problemy nemaju ale na to aby to vsetko
fungovalo potrebujeme, aby linuxove scsi drivery ovladali tzv. target
mode. Je to mod pri ktorom spolu vedia navzajom komunikovat dva (alebo
viac) SCSI radicov po spolocnej zbernici.
Zatial su upravene drivery len pre adaptec 1542 a este pre jeden, ktory mi
teraz nenapadane. Toto vsetko bolo urobene pre projekt IP over SCSI,
ktory ale uz relativne dlho stagnuje.

Takze pre spojenie dvoch pocitacov cez SCSI potrebujete najst spravnu
kombinaciu HW a jeho firmware a ovladac jadra ktory vie robit target mode.
Dalej tu vznikaju problemy, napr. pri (od)rezervacii diskov, pri SCSI
resetoch na zbernici, ktore dokazu dokonale zhodit pocitac, ktory ma
driver, ktory sa s tym nevie vyrovnat a podobne.
Preto pod Linuxom neexistuje ziadny "poriadny" HA cluster. Ano, su rozne
riesenia, ktore tu uz boli menovane, ale tieto problematiku vymeny a
synchronizacie dat bud ignoruju alebo ju riesia nejakym prepojenim po
sieti (napr. CODA-ou), co je najma pre databazove aplikacia viac nez
nedostacujuce.

Uz pred viac ako rokom som zacal pracovat na takomto clustri, ale narazil
som na vyssie uvedene skutocnosti ako aj na problemy s sg driverom v
kerneli. Momentalne prebieha "bitka" o podobu novej verzie sg drivera, no
uvidime ako sa to vyvinie a mozno na tom zacnem znovu pracovat.

K tomu odpajaniu a pripajaniu SCSI zariadeni za jazdy:
Samozrejme za normalnych okolnosti to nie je mozne. HW dodavatelia
pre HA riesenia dodavaju HotPlug zariadenia. Su to zvycajne
disky s SCA konektorom v specialnom elektricky upravenom puzdre, ktoreho
vytiahnutie a vlozenie nesposobuje na zbernici impulzy a ine nechutnosti.
Tieto disky maju zvycajne upraveny firmware. Samozrejme je potrebne
zabezpecit aby operacny system vo chvili vytahovania disku na nom nerobil
ziadne IO operacie (hlavne ked tam mame swap alebo root :-). Ale na to
zasa sluzia RAIDy roznej urovne ...

> K realizaci high availability clusteru ve stylu ASE od Compaqu je ovsem
> jeste potrebny zurnalovy filesystem. Existuje nejaky pouzitelny pro

Jurnalovy filesystem k tomu rozhodne nepotrebujeme, ale urcite by nebol na
skodu ;-).

> Linux? Nedavno jsem nekde videl anonci ext3 verze 0.0.2. Vzhledem k

Pokial viem tak ziadny funkcny zatial nie je.

S pozdravom
vsetky pocitace budu raz v clustri

						Robo

**************************************************************************
*	INTER-DATA s. r. o.     *    Phone: +421 7 443 73 710,443 73 714 *
*	Osadna 11               *    Fax:   +421 7 44373 053             *
*831 03 Bratislava              *    E-mail: robo na idata.sk               *
*	Slovak Republic         *    http://www.idata.sk                 *
**************************************************************************





Další informace o konferenci Linux