Problem s Raidem

David Haring dave na salsero.ibp.cz
Středa Říjen 10 16:21:17 CEST 2001


igor.bujna na maxi-tip.cz (Igor Bujna) writes:

> Zdravim,
> dnes jsem nasel v logu docela zajimavy vypis.Mam RH 6.2 kernel s jadrem 
> 2.2.19-6.2.1 a ide-patchem a reiserfs-patch.Na nize uvedene partition je 
> ale ext2.
> Tak nevim jestli je neco s jadrem nebo mi odesly IDE disky(oba Westerny 
> - WDC WD273BA).
> A nyni mam v mdstats toto:
> md2 : active raid1 hdc4[1](F) hda4[0](F) 19531904 blocks [2/1] [_U]
>
> Oct 10 04:15:51 samba kernel: raid1: Disk failure on hda4, disabling device. 
> Oct 10 04:15:51 samba kernel: attempt to access beyond end of device 
> Oct 10 04:15:51 samba kernel: 03:04: rw=0, want=30003444, limit=19532016 
> Oct 10 04:15:51 samba kernel: dev 09:02 blksize=4096 blocknr=544371772 
> sector=60006880 size=4096 count=1 
> Oct 10 04:15:51 samba kernel: raid1: Disk failure on hda4, disabling device. 

to muze byt treba i chybou FS. Ovladac raidu pro 2.2.x nekontroluje, jestli 
pozadovany blok nahodou nepresahuje fyzickou velikost zarizeni (coz by za 
normalnich okolnosti samozrejme nemelo nastat). Pokud takovy pozadavek ovladaci 
raidu prijde, fyzicke zarizeni pochopitelne vrati I/O chybu, protoze se po nem 
chce cist neco co neexistuje a raid vyhodi disk z pole. Ovladac raidu pro jadra 
2.4.x uz si toho vsimne a disk kvuli tomu z pole zbytecne nevyhodi.

V kazdem pripade to ale vypada na problem mimo raid (FS?), pripadne chybu pri 
konfiguraci (nesedici velikosti partititions, raid zarizeni, souboroveho 
systemu)

pro ilustraci, k chybe "attempt to access beyond end of device" 
se muzete dostat i napr. takto:
- mate partition hda1 na niz mate souborovy system ext2
- rozhodnete se udelat raid1 z hda1 a hdb1
- nahodou se pri rekonstrukci odzrcadli hda1 na hdb1
- tim padem muzete pripojit md0 se zdanlive funkcnim ext2 fs
- jenomze data na konci fs jsou prepsana raid superblokem, takze az k nim
  system bude chtit pristoupit, tak zjisti ze nesedi velikost raid svazku 
  souboroveho systemu (fsck by to potvrdil) a vrati zminenou chybu
- spravny postup by samozrejme byl po vytvoreni raid svazku znovu vytvorit fs

zdravi David Haring



Další informace o konferenci Linux