high availability (was: Re: RH 6.1 - zklamani - dlouhe)

Pondělí Říjen 25 21:38:48 CEST 1999

Hola,

Robert Dobozy wrote:
> 
> [pozn.: dako som sa rozpisal, tak je to trosku dlhe ...]
> 
Ale na rozdil od mnoha jinych jste napsal take nejake informace, diky za
ne.
Ostatne ted to bude mozna jeste delsi, a asi s mene informacemi ;-).

> V principe pozname dva druhy High availability clustrov:
> 1. switchover cluster
> 2. tzv. True cluster (terminologia Digitalu - Compaqu)

K tomu prvnimu typu patri i Compaq - Digital ASE, o kterem jsem se
zminil. Oni sice pozdeji zacali vsemu rikat TruCluster, ale to je jen
obchodni politika.

Princip je takovy, ze existuji tzv. sluzby, z nichz kazda bezi v danem
okamziku na jednom z n-tice serveru. K premisteni sluzby dojde bud
automaticky po vysypani serveru, nebo zasahem administratora. Premisteni
spociva v tom, ze prislusne procesy se nejprve na jednom serveru killnou
(pokud to jeste jde :-)) a pak na druhem spusti. Takze nic nikde nebezi
paralelne.

> fungovalo potrebujeme, aby linuxove scsi drivery ovladali tzv. target
> mode. Je to mod pri ktorom spolu vedia navzajom komunikovat dva (alebo
> viac) SCSI radicov po spolocnej zbernici.

Konecne nejake konkretni informace o problemech, na rozdil od
nadseneckeho "vsechno jde". Nemate nejaky tip na zdroj podrobnejsich
informaci o programovani SCSI (nejen pod Linuxem, ale spis obecne)?

Ale jeste jedna vec: mozna neni bezpodminecne nutne, aby ty radice
komunikovaly spolu, stacilo by, aby kazdy z nich mohl ovladat pripojena
zarizeni (v danem okamziku disjunktni podmnozinu, jak jsem o tom psal) a
druhy ho pri tom nerusil.

Jeste jednou diky za obsazny prispevek, ale...

> Jurnalovy filesystem k tomu rozhodne nepotrebujeme, ale urcite by nebol na
> skodu ;-).

... sorry, potrebujeme. Prave pro ten switchover cluster. Jestlize
nejaka sluzba, ktera pouziva disky, je premistena z jednoho serveru na
druhy proto, ze ten prvni vzplal jasnym plamenem, pak je zrejme, ze
vzplanuvsi server zrejme disky regulerne neodmontoval. Takze druhy, nez
je primontuje, musi provest fsck. A v clusteru je nutno, aby toto fsck
probehlo:
1. co nejrychleji,
2. s co nejvetsi pravdepodobnosti uspechu bez lidskeho zasahu.
Jinou moznost nez zurnalovy filesystem neznam.

Samozrejme, teoreticky muzeme nekdy vystacit s nediskovymi sluzbami a s
databazemi, ktere pouzivaji raw device, ale to je prece jen moc silne
omezeni.

-- 
Ivo Zacek <izacek na sky.cz>, Supervisory Systems s.r.o. Brno