zbourany filesystem (delsi)

Michal Hucik chaky na goliash.inext.cz
Neděle Březen 7 17:02:26 CET 1999


Hi,
	pred nejakou dobou jsem tady psal o tom, jak se mi na nekolika
systemech zboural filesystem (v adresari mrtg se zmenily permissions a flagy
jednotlivych souboru a nepodarilo se to opravit ani pomoci fsck). Tehdy se
mi to prihodilo na trech systemech v casovem rozsahu cca jednoho mesice.
Postizene systemy mely ruzne verze kernelu 2.0.33-35, odlisny HW a ruzne
druhy distribuce redhat... Jedinym spolecnym ukazatelem bylo to, ze na vsech
systemech bezelo mrtg a ze byly poskozeny jen datove soubory z adresare
mrtg. Po mem dotazu do tohoto listu zda nekdo netusi co mohlo byt pricinou
padu jsem obdrzel odpovedi ve smyslu 'mrtg za nic nemuze - je to chyba HW'.

Ok. Preformatoval jsem disky, znovu nainstaloval a mrtg nechal bezet jen na
jednom systemu. Po cca 1/2 rocnim klidu jsem musel tento system restartovat
a po spusteni mne pozadal o rucni spusteni fsck:

------
# e2fsck /dev/hda1
e2fsck 1.12, 9-Jul-98 for EXT2 FS 0.5b, 95/08/09
/dev/hdc1 contains a file system with errors, check forced.
e2fsck: Illegal doubly indirect block found while reading bad blocks inode
This doesn't bode well, but we'll try to go on...
Pass 1: Checking inodes, blocks, and sizes
Error while scanning inodes (0): The inode is from a bad block in the inode
table

# echo $?
8
------

Nejsem si zcela jisty zda od posledniho padu fs nebyl nahodou i zde vymenen
HW, ale kazdopadne se mi zda tato udalost velmi prapodivna. Staram se o
pomerne velky pocet Linuxovych serveru a s podobnym fenomenem jsem se jeste
nikde jinde nesetkal. Jedine cim se zbourane systemy lisi od tech stabilnich
je jiz zminovane mrtg, ktere bezi v pomerne velke zatezi (5 minutovy
interval je temer na hranici toho, kdy mrtg zpracuje udaje z predchoziho
spusteni). 
Tentokrat se jak se zda neposkodily data v mrtg, ale odnesly to clanky v
adresari news + nejaka posta a byly prepsany nektere binarky. Nastesti jsem
mel k dispozici jeste jeden HDD, takze jsem tarem presunul vse co nehlasilo
chybu pri pristupu na soubory a ted pracne kontroluji integritu vsech
programu na disku.
Zde je pro zajimavost vyber nekterych udaju z 'ls -l' v adresari s newsovymi
prispevky jedne skupiny:

---
-rw-rw-r--   1 news     mail         1046 bře  5 06:19 1075
?rwsrwsrwt 65535 65535    65535    4294967295 led  1  1970 1076
?rwsrwsrwt 65535 65535    65535    4294967295 led  1  1970 1077
?rwsrwsrwt 65535 65535    65535    4294967295 led  1  1970 1078
?rwsrwsrwt 65535 65535    65535    4294967295 led  1  1970 1079
-rw-rw-r--   1 news     mail         1104 pro 28 10:26 108
?rwsrwsrwt 65535 65535    65535    4294967295 led  1  1970 1080
?rwsrwsrwt 65535 65535    65535    4294967295 led  1  1970 1081
drwxr-xr-x   2 root     root         1024 lis 19 18:22 1082/
drwxrwx---   2 news     mail         1024 bře  4 07:23 1083/
-rw-rw-r--   1 news     mail         1574 bře  5 08:43 1094
pr--rw--wt   5 sync     4927            0 led  2  1970 1095|
-rw-rw-r--   1 news     mail         1367 bře  5 09:19 1096
---
(puvodnim vlastnikem byl samozrejme news.news)

Nenapada vas nekoho cim by mohly byt tyto pady zpusobeny a jak by se dal
takto poskozeny disk opravit?

Ahoj -
	Michal
--
"mailto:chaky na foresta.cz","mailto:chaky na vs.inext.cz",2:421/450.55 na fidonet
 Michal Hucik, FORESTA SG a.s.           "http://goliash.inext.cz/~chaky/"
 Phone/Fax +42 657 687111/687199                          +42 0603 878178
 Vsetin, Czech Republic                           My computer - My castle

    ---===   Beskyde, Beskyde, kdo po tobe SCSI ... ?   ===---


Další informace o konferenci Linux