Zrejme chyba v jadre Linuxu? (Re: Linux je na h...)

Petr Snajdr snajdr na firma.seznam.cz
Středa Červenec 14 13:14:17 CEST 1999


On Wed, 14 Jul 1999, Petr Tesarik wrote:

Dovolil jsem si zmenit subjekt na mene emotivne zamereny :-)

> Pada... Kazdy den. A jeste k tomu postupne. Nejdriv se zblazni kus
> TCP/IP kodu, takze jakykoli SYN paket na port 80 se loguje jako SYN
> flood a pozdeji uplne odumre TCP/IP, coz u vzdalene administrovaneho
> stroje znamena, ze musim volat technickou podporu, at to
> prebootuje... :(

Neco podobneho jsem jiz take videl, upne do puntiku.
Po x experimenetch jsem dosel k zaveru, ze minimalne HW
je v tom nevine. Prijde mi to opravdu jako nejky bug
v kernelu. Obecne se mi zda, ze zvalste u zatizenych
serveru mohou byt s jadrem nejake problemy.

Onecem v tomto smyslu se zinoval nekdy drive v teto konferenci tusim
i Michal Krause. Jak to nakonec dopadlo?
 
> BTW dalo by se nejak vymyslet, aby (kdyz uz tem padum nezabranim) se
> to alespon nejak automaticky rebootovalo? watchdog device je sice
> fajn, ale tohle neodhali, protoze jadro jede dal, jenom prestane
> fungovat TCP/IP. :-((

Podle toho co jsem sledoval tak stav vypada takto:
 pocitac bezi jako by se nic nedelo, pouze sit je naprosto mimo s tim, ze
netstat ukazuje radu spojeni, ktera timeoutuji (zrejme). 
Ze site se na pocitac samozrejme take nelze dostat a ani nepinga.

Zkousel jsem si na tohle napsat kraticky program, ktery pingne 
na okolnich x pocitacu a pokud se nedostane ani
na jeden tak rebootne pocitac. Bohuzel rekl bych, ze
ten ping "umrzne" taky a tak to nefunguje.

Moznosti je nekolik:

obcas porovnat netstat -ant a pokud se dlouho nic nemeni tak rebootovat,
pokusit se zjistit zdali pres nejaky interface tecou nejaka data
a vubec mnetody tohohle razeni. 

"hlidaci pes" je v tomhle pripade vazne k nicemu.

> A nejhorsi na vsem je, ze na tom samem jadru (2.0.36) to bez problemu
> fungovalo od jeho uvedeni az do pondeli, ale od pondeli to pada
> denne. Ze bych pro zmenu zkusil FreeBSD..?

Chce to zjistit zdali to neni:

	- HW chybou
	- tim ze na pocitac nekdo utoci
	- neni nejaky neporadek po siti nebo neco
	  v neporadku se sitovkou (prohlednout logy, podivat
          se na pocty chyb, kolizi atd.)
	
	- vyzkouset jina jadra, vyfiltrovat cokoliv
	  na co nema kdo chodit pres ipfwadm nebo ipchains atd.

	- zamyslet se nad tim FreeBSD. Osobne mi to prijde jako
          dobra volba. Uz delsi dobu se nemohu ubranit
          tomuto myslenkovemu pochodu:
		Microsoft -> (RedHat) -> Linux -> FreeBSD
	 Je to jen muj osobni nazor, prosim radeji na nej nereagujte
         do konference.

--

S pozdravem
   Petr Snajdr

Seznam Ceskeho Internetu: http://www.seznam.cz/
Magazin pro kazdeho: http://www.novinky.cz/
Seznam Dnes: http://dnes.seznam.cz/
Navody, recenze, technika: 
http://www.novinky.cz/Index/TechDesk/ 




Další informace o konferenci Linux