Clustering, databaze a sdileni dat

stano na trillian.eunet.sk stano na trillian.eunet.sk
Pondělí Prosinec 13 19:52:56 CET 1999


On 13 Dec 1999 16:30:04 +0100, Michal Krause wrote:

: od modulu pro Apache), v zavislosti na tech datech se bud sahne do te
: cache, ktera muze byt delena, paklize bude zajisteno, ze hit pro jeden
: identifikator bude chodit vzdy na stejny stroj. Paklize je toto pravidlo
: dodrzene, pak zaroven lze delit i databazi na vice stroju.

No, to uz je vynikajuca informacia. Inymi slovami data
pre rozlicne id sa nijako "nemiesaju" a pokial
to dovediem do extremu, mohlo by mat kazde
id dedikovany pocitac :-)

Vseobecnu architekturu by som potom videl dvojstupnovo:

Prva vrstva su "rozdelovace", ktore su bezstavove
a akurat spravia nejaky hash z id a podla vysledku
posunu request na urceny pocitac. Snad by som aj
zahodil Apache a urobil jednouceloveho demona
(niekto musi aj zase efektivne dorucit odpovede
nazad), ale do tejto oblasti nevidim.

Druha vrstva su potom stroje so samostatnymi SQL servermi
a samostatnou cache, pricom obsluhuju konkretnu mnozinu id.

Tym padom sa da riesit rozlozenie zataze tak na urovni
prichadzajucich pristupov (podla IP klienta - prva vrstva),
ako aj na urovni SQL backendu (podla id).

Uzke hrdlo nema kde vzniknut - rozsirovat sa da tak
prva vrstva, ako aj druha a pokial by nestihala
siet medzi nimi (co by som dost pochyboval :-)),
da sa znasobit aj ta.

Pridanie stroja ovsem nie je trivialne (pokial chvilkova
odstavka nie je mozna) - viac-menej treba prehashovat
tie data medzi backendami. Bohuzial neviem, o ake mnozstva
sa jedna a co je mozne pocas takejto administrativnej
akcie tolerovat.

V zaciatkoch samozrejme moze prva vrstva zdegenerovat
na jeden stroj.

Prehliadol som nieco?

Mimochodom, 4 mil. query denne, z toho polovica zapisov,
na jednoprocesorovej masine s jednym SQL serverom,
to teda klobuk dolu...

Zdravi
-- 
				Stano



Další informace o konferenci Linux