Kernel panic & Segmentation fault -- delsi popis problemu

Jaroslav Prodelal ogee na oldany.cz
Úterý Říjen 4 22:23:16 CEST 2005


Dobry den,

   rad bych se zeptal, zda nemate nekdo tuseni cim by mohlo byt
zpusobene nasledujici:

Mame 2 stroje s Athlon64 4400+ XP, 4GB RAM, disky 2x WDC WD740GD-00FL OS
CentOS 4.1. Jadro pouzivame vlastni 2.6.13 a z jednim z nich zacly byt
problemy - zlobi i na distribucnim jadre. Distro jadro neni mozne uplne
testovat, protoze ma problem s IOMMU, tak ho v normalni rezimu nepouzivame.

Je tam RAID0 pres ty dva disky, resp. pres 2 partition, pro '/' a ten se
poskodil. Nabootoval jsem z jineho distra, opravil pomoci e2fsck -y -v
/dev/md0 a bylo to OK. Hlasilo to, ze to nema super-block nebo ze je
poskozeny.

Po dalsim bootu OK, pak se to zase rozpadlo, tak znova a znova nekolikrat.

Pote se parkrat objevil 'Kernel Panic' (jednou z pricin pravdepodobne
konflikt mezi modulem drbd.ko a sk98lin.ko - ne z jadra, ale vlastnim
zkompilovany), ty jsem ale pak odstranil a stejne kernel panic se objevil.

Zase se rozboril md0, tak jsem nabootoval do servisniho distra na jinem
oddelenm disku (stejne jako predtim) a a dal znova e2fsck, ktery ale
konci segfaultem a to jak s novym, tak s distribucnim jadrem, s vypnutou
highmem i zapnutou (v biosu).

Ted se v logu objevuje:

Oct  4 22:06:19 kamil kernel: warning: many lost ticks.
Oct  4 22:06:19 kamil kernel: Your time source seems to be instable or
some driver is hogging interupts
Oct  4 22:06:19 kamil kernel: rip __do_softirq+0x49/0xa2

a pro ten e2fsck:
 e2fsck[11671]: segfault at 0000000000000010 rip 0000000000418684 rsp
0000007fbffff130 error 4

Druhy stroj tyto problemy nema a je to uplne stejne zelezo.

Nevite, co by to mohlo znamenat?

   Dekuji za kazdy hint!

--ogee


Další informace o konferenci Linux