Problem s RAID1 pres mdadm

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Neděle Listopad 18 16:09:19 CET 2007


On Thu, 15 Nov 2007 al.linux na bcpraha.com wrote:

> Stala se nam zvlastni vec - jedna z instanci virtualnich serveru sletela
> zrejme v dusledku chyby pri cteni z RAID subsystemu

Nevím, tohle vypadá dost zvláštně:

> Nov 15 14:14:28 omega kernel: qemu-dm[6305]: segfault at 0000000000000000
> rip 0000000000000000 rsp 0000000041000ca8 error 14

Časově to sice celkem koinciduje s těmi potížemi na RAIDu, ale že by to 
udělalo neošetřený jaderný 

Zdá se, že tohle Wokna ročník 2003 dělají pod Xen HVM, když jsou moc 
diskově vystresovaná:

<http://bugzilla.xensource.com/bugzilla/show_bug.cgi?id=1038>

Jinak ten disk sdb bych asi zkusil pro jistotu celý přečíst pomocí dd, 
jestli je něm opravdu chyba nebo ne (ale možná byl ten vadný sektor 
relokovaný, tak už nebude vidět). Možná by to chtělo zkontroloval, zda 
jsou na všech zůčastněných discích správná data, ale nějak nevím, jestli 
to linuxový raid umí sám od sebe. Možná by stačilo napsat nějaký 
heuristický program, co přečte všechny disky a RAID, porovná to, pokud to 
nesouhlasí, tak to párkrát zopakuje pro případ, že by zrovna docházelo
k zápisu na to místo, a kdyby to furt nesouhlasilo, tak zahlásí problém.

--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."




Další informace o konferenci Linux