Dychavicny server s Athlonem

Michal Krause michal na krause.cz
Neděle Únor 13 01:00:43 CET 2000


Zdravim,

opet jsem se dostal do problemu. Dnes jsem upgradovali server z PIII 450
na K7 600 a i presto, ze jsem na mnoha mistech nachazel informace o tom,
ze pouziti K7 je naprosto bezproblemove, ja z toho mam problemu az nad
hlavu (to bych ani nebyl ja, kdyby se neco povedlo hned napoprve :( ).

Aktualni situace je nasledujici:

K7 600, MB MicroStar MS-6167, radic s chipsetem AMD 756 Viper (Ultra
DMA/66), 256 MB RAM (2x 128 SDRAM 100 MHz), sitova karta eepro/100, HDD
Quantum Fireball 3,2 GB a IBM DJNA-371350 a nejaka obycejna grafika (S3,
asi Trio, nejsem si ted jist).

Krome MB a CPU tam vsechno bylo i pred upgradem.

A ted k problemu. Server funguje rozumne jenom tehdy, pokud je odpojen
od site, respektive kdyz nejede Apache (HTTP je klicova sluzba). Jakmile
Apache nahodim, stane se ze serveru cosi s vykonem 386ky s vypnutym
turbem. Podle me nekde sakra vazne sitova komunikace smerem ven, protoze
se neskutecnym zpusobem zacnou mnozit half-open konexe (po chvili jich
je treba 5000) a na server se velice tezko pripojuje zvenci (toto plati,
i kdyz Apache nejede a vytizeni klesne).

Samozrejme to svadi k dojmu SYN flood ataku, coz jeste podporuje fakt,
ze zhruba 10% half-open konexi pochazelo z jakesi univerzity v
Novosibirsku, ale na druhou stranu by byla hodne divna nahoda, kdyby se
tohle stalo zrovna v dobe upgradu. Navic proti teorii utoku hovori to,
ze server je zvenku nepouzitelny i kdyz na portu 80 nic neni (treba ssh
ma odezvy v desitkach vterin, kdyz potom v nahlem zachvevu funguje asi
tak dve vteriny dobre).

Dalsim aspektem poukazujicim na nejaky hardwarovy problem je fakt, ze
driver sitovky casto tvrdi, ze "eth0: card reports no resources.". Pokud
se nemylim, znamena to, ze se zaplni jakysi kruhovy buffer karty.

A posledni veci poukazujicim na nejaky problem je dobra kompilace jadra.
Kdyz jsem server uplne zklidnil, tak trvala kompilace 6 minut (i to se
mi zda skoro dost v porovnani s PIII, ale dejme tomu). Jenze behem
laborovani v prubehu dne jsem jadro kompiloval vicekrat a i kdyz Apache
nebezel, protahlo se to klidne i na 20 minut. Zrejme je to dusledek
toho, ze pokles loadu po shozeni Apache je jenom velice pozvolny,
ackoliv drive sla krivka vytizeni v takovem pripade rapidne dolu. Asi
neni bez zajimavosti, ze ackoliv load byva pomerne vysoky, vytizeni
procesoru kolisa mezi jednim a tremi procenty. Ten Athlon se tam zkratka
flaka!

Zitra se pokusim problem lokalizovat vymenou jednotlivych komponent,
jenze tim stejne nezjistim, jestli je problem ve vadne soucasti, nejakem
spatnem nastaveni hardwaru (casovani pameti, PCI atd.) nebo treba v
jadre (2.2.15-pre5 + posledni Hedrickuv patch s podporou chipsetu
Viper). Zkousel jsem uz menit nastaveni vseho mozneho, disk jsem zkousel
jako DMA/66 i DMA/33 (s i bez nastaveni firmwaru, s i bez specialniho
kabelu), jeste zvazuju upgrade BIOSu, ale to uz je jenom akt zoufalstvi.

Chtel jsem se tedy zeptat, jestli nahodou nekoho nenapadne mozna (nebo
pravdepodobna) pricina tohoto chovani nebo neco, co by mohlo vest k jeho
(promptnimu) vyreseni. Ja jsem prakticky v koncich.

P.S. Prave jsem v logu nasel hlasku
kernel: gfp called by non-running (1) task from c01218a6!
To vidim vazne poprve...

Diky za pripadne tipy...

S pozdravem
--
Michal Krause                                                      /\
ICQ: 7665279            Informace (nejenom) ze sveta Linuxu     /\/  \
email: mike na navrcholu.cz ______ http://www.root.cz/ ______ NAVRCHOLU.cz

Co napsat do signatury, aby to nikoho nepohorsilo? Snad jedine nejakou
obecne znamou pravdu. Doufam, ze vsichni vite, ze tucnak je bylozrava ryba. 


Další informace o konferenci Linux