Zahlceni/pretizeni diskoveho pole raid1 u DELL SC 430 na debian sarge

Daniel Prynych Daniel na prynych.cz
Čtvrtek Leden 17 14:21:37 CET 2008


Dobre dopoledne,
nedavno jsem prisel na zajimavy (a pro mne neprijemny) problem po provedeni 
upgrade jadra DSA-1436-1 linux-2.6. /predchazejici upgrade DSA-1428-2 
linux-2.6 jsem pro nepritomnost neprovedl /

 
  Po provedeni upgrade /apt-get upgrade/ a naslednem restartu PC pracoval asi 
24 hodin, nasledne stoupla zatez (uptime) asi na cca 30 a chvilemi az na cca. 
50, protoze PC nesel prakticky pouzivat, a z logu nebyl zjisten zadny problem 
byl proveden restart, po restartu se system natahoval velmi pomalu asi po 
pulhodine se dostal do poloviny startovacich scriptu a druhy disk, provozoval 
velky hluk.
  Pri startu system se na obrazovce a v logu se objevilo toto hlaseni:
ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2 frozen
ata1.01: tag 0 cmd 0xb0 Emask 0x2 stat 0x50 err 0x0 (HSM violation)
  System by opet vypnut a druhy disk odpojen. Po zapnuti system bezici na 
jeden disk nastartoval normalne. Opet vypnuto a pripojeni druheho disku pres 
jiny kabel. System nabehl normalne byla provedena synchronizace pole. Nekdy 
po 24 az 48 hodinach se situace opakovala opet velmi vysoka zatez a system 
prakticky nepouzitelny. Nasledovaly konzultace s DELLem, navrzena vymena 
disku, zhruba po 24 opet vemi vysoka zatez, system nepouzitelny. Nasledovalo 
vypnuti, vymena kabelu, prepojeni kabelu na jiny kanal, start a synchronizace 
disku. Po cca 24 hodinach nebo o neco vice se situace opakuje. Pripominam ze 
druhy disk vydava velky hluk.
Byl proveden posledni pokus druhy disk odpojen vse v poradku, opet vypnuti
stary kabel byl vracen na puvodni kanal pripojen zpet druhy disk ale 
nastartovano bylo /stare/ jadro "2.6.18-4-686" disky synchronizovany. 
Po zhruba tydenim provozu vse pracuje bez problemu. Hlaseni ata1.01 ... se 
neobjevuje.

------------ rekapitulace -----------------
Domnivam se ze nekde v upgrade DSA-1436-1 linux-2.6. nebo DSA-1428-2 linux-2.6 
je problem. ktery se projevi minimalne na DELL SC 430 pokud pouziva raid1 a 
disky SATA ST3160812AS 
 

Upresneni: system je Debian Etch jadro 2.6.18-5-686,
disky: ST3160812AS
softwarovy raid1 /realizovany pres mdadm/
-------------- vypis lspci ----------------
00:00.0 Host bridge: Intel Corporation E7230 Memory Controller Hub
00:01.0 PCI bridge: Intel Corporation E7230 PCI Express Root Port
00:1c.0 PCI bridge: Intel Corporation 82801G (ICH7 Family) PCI Express Port 1 
(rev 01)
00:1c.4 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express 
Port 5 (rev 01)
00:1c.5 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express 
Port 6 (rev 01)
00:1d.0 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #1 
(rev 01)
00:1d.1 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #2 
(rev 01)
00:1d.2 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #3 
(rev 01)
00:1d.3 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI #4 
(rev 01)
00:1d.7 USB Controller: Intel Corporation 82801G (ICH7 Family) USB2 EHCI 
Controller (rev 01)
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev e1)
00:1f.0 ISA bridge: Intel Corporation 82801GB/GR (ICH7 Family) LPC Interface 
Bridge (rev 01)
00:1f.1 IDE interface: Intel Corporation 82801G (ICH7 Family) IDE Controller 
(rev 01)
00:1f.2 IDE interface: Intel Corporation 82801GB/GR/GH (ICH7 Family) Serial 
ATA Storage Controller IDE (rev 01)
00:1f.3 SMBus: Intel Corporation 82801G (ICH7 Family) SMBus Controller (rev 
01)
04:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5751 Gigabit 
Ethernet PCI Express (rev 01)
05:02.0 SCSI storage controller: Adaptec ASC-39320A U320 (rev 10)
05:02.1 SCSI storage controller: Adaptec ASC-39320A U320 (rev 10)
05:04.0 Ethernet controller: Digital Equipment Corporation DECchip 21140 
[FasterNet] (rev 22)
05:07.0 VGA compatible controller: XGI - Xabre Graphics Inc Volari Z7
------------------------------------------------------------------------------

Mate nekdo nejaky napad, kde muze byt problem?

Dekuji 
Daniel Prynych
 



Další informace o konferenci Linux