Clustering, databaze a sdileni dat

Mikulas Patocka mikulas na artax.karlin.mff.cuni.cz
Úterý Prosinec 14 00:21:02 CET 1999


>> >To bohuzel nepujde. Indexem neni jenom IP adresa, ale jeste ID stranky,
>> >jiz se hit tyka, takze by to opet znamenalo posun nekam do aplikacni
>> >vrstvy.
>>
>> Jaka je presne struktura te cache? Jak to vlastne cele funguje?
>
>Struktura je primitivni. Hash, indexem je kombinace IP adresy a ID
>(napr. 194.213.32.20800001054), vracena hodnota je timestamp posledniho
>pristupu, pokud je rozdil now - value mensi nez 20 minut, neni pristup
>povazovan za unikatniho navstevnika. Nadrazenym mechanismem jsou
>cookies, ktere zajisti, ze rekneme v 80 az 90% pripadech neni potreba do
>te cache sahat, protoze timestamp mam uz v te cookie.
>
>At uz je hodnota ziskana z cookie ci z hashe, dalsi postup je stejny.

Pak to ale znamena, ze by ta cache sla distribuovat dost dobre.

Treba pro 4 webservry by se router mohl nastavit tak, aby vsechny
packety s adresou delitelnou 4 posilal na jeden webserver, s adresou,
co dava zbytek 1 na druhy atd. Webservry ziskaji timestamp a muzou to
podle ID stranky poslat jednomu z nekolika databazovych servru. Jediny
bottleneck je zde propustnost site; web i databazovych servru je mozno
pridat libovolne mnoho.

Jeste jedna idea: Je k tomu vubec potreba Apache? Kdyby se napsal
programek v C, co z hlavicky HTTP requestu rychle vyparsuje cookie,
posle predem pripraveny obrazek a spoji se s databazi - nebylo by to
rychlejsi? (zdrojaky Apache jsem nevidel, tak nevim, jak moc velky
overhead v nem vznika)

Mikulas


Další informace o konferenci Linux