SATA, SW RAID, nestabilni system

Antonín Mička antonin.micka na megasphera.cz
Úterý Leden 31 10:43:08 CET 2006


Dne út 31. leden 2006 10:18 Roman Paral napsal(a): 
"SATA, SW RAID, nestabilni system"

> Dobry den,
>
> malinko bych potreboval poradit,
>
> mam server zhruba nasleduji konfigurace:
...
>
> nainstalovan Debian stable, kompilovane jadro 2.6.15 #1 SMP
>
> v jadre ohlede SATA:
>
...
>
> vytvoren SW RAID 1 na vsech diskovych oddilech
>
> Pri pristupu na disk se zacal pocitac kousat, vzdy po resetu a obnove pole
> vydrzel bezet o neco dele,
> nechal jsem proto cist cely disk (dd if=/dev/sda of=/dev/null..), ale vedlo
> to k nasledujicimu stavu viz vypis /var/log/messages
> po resetu je vypis stavu pole /proc/mdstat a cast vypisu smartctl.
>
> Muze byt problem s ovladacem na SATA, pripadne nekde neco spatne nastaveno,
> nebo treba i HW problem s diskem, mate nejakou zkusenost?
>
> Dekuji moc, Roman Paral
>
> ...

Dobrý den, 

V následujícím výběru z výpisu jsem vám vypsal podle mě nedůležitější 
hlášení. Zkuste zjistit, co ty chybové kódy znamenají. Možná vám to pomůže.
 
> Jan  9 22:41:38 wifi2 kernel: ata1: status=0xd0 { Busy }

Tady to asi hlásí, že zařízení je zaneprázdněné

> Jan  9 22:42:08 wifi2 kernel: sd 0:0:0:0: SCSI error: return code =
> 0x8000002 Jan  9 22:42:08 wifi2 kernel: sda: Current: sense key=0xb

> Jan  9 22:42:08 wifi2 kernel: end_request: I/O error, dev sda, sector
> 35150028 Jan  9 22:42:08 wifi2 kernel: ^IOperation continuing on 1 devices

Tady to zase hlásí, že na jednom zařízení se operace ještě provádí

> Jan  9 22:42:38 wifi2 kernel: ATA: abnormal status 0xD0 on port 0x1F7
> SeekComplete Error } Jan  9 22:42:42 wifi2 kernel: ata1: error=0x04 {

Je možné, že občas nějáký disk "nestihne" dokončit zapis/čtení. 
V RAID poli totiž musí disk dokončit operaci o něco dříve než v situaci, kdy 
je "single", protože opoždění může způsobit rozpad pole (vlastně celé pole by 
se teoreticky mělo chovat jako jeden disk). (je taky možné, že je příčina 
jinde)

S pozdravem

Antonín Mička
===========


Další informace o konferenci Linux