Problem s RAID1 pres mdadm
Pavel Kankovsky
peak na argo.troja.mff.cuni.cz
Neděle Listopad 18 16:09:19 CET 2007
On Thu, 15 Nov 2007 al.linux na bcpraha.com wrote:
> Stala se nam zvlastni vec - jedna z instanci virtualnich serveru sletela
> zrejme v dusledku chyby pri cteni z RAID subsystemu
Nevím, tohle vypadá dost zvláštně:
> Nov 15 14:14:28 omega kernel: qemu-dm[6305]: segfault at 0000000000000000
> rip 0000000000000000 rsp 0000000041000ca8 error 14
Časově to sice celkem koinciduje s těmi potížemi na RAIDu, ale že by to
udělalo neošetřený jaderný
Zdá se, že tohle Wokna ročník 2003 dělají pod Xen HVM, když jsou moc
diskově vystresovaná:
<http://bugzilla.xensource.com/bugzilla/show_bug.cgi?id=1038>
Jinak ten disk sdb bych asi zkusil pro jistotu celý přečíst pomocí dd,
jestli je něm opravdu chyba nebo ne (ale možná byl ten vadný sektor
relokovaný, tak už nebude vidět). Možná by to chtělo zkontroloval, zda
jsou na všech zůčastněných discích správná data, ale nějak nevím, jestli
to linuxový raid umí sám od sebe. Možná by stačilo napsat nějaký
heuristický program, co přečte všechny disky a RAID, porovná to, pokud to
nesouhlasí, tak to párkrát zopakuje pro případ, že by zrovna docházelo
k zápisu na to místo, a kdyby to furt nesouhlasilo, tak zahlásí problém.
--Pavel Kankovsky aka Peak [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."
Další informace o konferenci Linux