Kernel oops, XEN dom0 a wheezy 3.2.0-4

Josef Krieglstein josse na trenet.org
Úterý Červenec 16 07:55:41 CEST 2013


Dobrý den,

Nedokázal by mě někdo poradit proč mi to padá ?

 

HW: AMD FX-4300 (VISHERA), základní deska už druhá (u první jsem podezříval
přehřívání, možná to byla jen špatně ukazovaná teplota)

SW: Čistý Debian Wheezy, kernel 3.2.0-4, žádné domU virtuály neběží. Když
spustím bez xen hypervisora žádný oops nenastane. XEN by měl být asi
4.1.4-3+deb7u1: amd64

 

Při kopírování dd, cat a nc(netcat), ze souboru, blokového zařízení, ze
sítě, do souboru i blokového zařízení. Je jedno jestli přímo /dev/sda5,
/dev/md1, nebo LVM oddíl.

Po přenesení cca 1GB (pravděpodobně spíš míň), se systém restartuje nebo se
zastaví s následujícím výpisem.

 

Vyzkoušel jsem xsave=0 předat jádru při startu (žádná změna, kromě toho že v
/proc/cpuinfo už není xsave uvedeno), našel jsem že nějaká verze XEN se
nemusí chovat stejně k parametrům xsave=0, noxsave, noxsaveopt, ty dva
poslední jsem ještě nevyzkoušel (mám jeden až dva pokusy na den).

 

Už dvakrát se mi podařilo zachytit debug kernelu, posílám začátek, ke zbytku
se momentálně nedostanu, celý můžu zaslat nebo vystavit na webu, pokud by to
k něčemu bylo.

 

Díky

 

Josef Krieglstein

 

Jul 15 16:47:53 xen1 kernel: [  955.374381] BUG: unable to handle kernel
paging request at ffff88013fc01020

Jul 15 16:47:53 xen1 kernel: [  955.374398] IP: [<ffffffff810eba66>]
cache_grow+0xef/0x217

Jul 15 16:47:53 xen1 kernel: [  955.374409] PGD 1606067 PUD b9cf5067 PMD
b9ef4067 PTE 0

Jul 15 16:47:53 xen1 kernel: [  955.374420] Oops: 0002 [#1] SMP

Jul 15 16:47:53 xen1 kernel: [  955.374427] CPU 1

Jul 15 16:47:53 xen1 kernel: [  955.374433] Modules linked in: drbd
lru_cache xen_gntdev xen_evtchn xenfs nfsd nfs lockd fscache auth_rpcgss 

nfs_acl sunrpc bridge stp loop snd_hda_codec_hdmi nouveau ttm drm_kms_helper
drm i2c_algo_bit mxm_wmi power_supply video wmi sp5100_tco
snd_hda_codec_realtek snd_hda_intel powernow_k8 mperf edac_core edac_mce_amd
psmouse fam15h_power k10temp snd_hda_codec pcspkr 

snd_hwdep serio_raw i2c_piix4 crc32c_intel ghash_clmulni_intel evdev snd_pcm
aesni_intel cryptd snd_timer snd aes_x86_64 soundcore i2c_core aes_generic
snd_page_alloc processor button thermal_sys ext3 mbcache jbd dm_mod raid1
md_mod sg sd_mod crc_t10dif 8139too 8139cp

  ohci_hcd ahci libahci libata scsi_mod ehci_hcd xhci_hcd r8169 mii usbcore
usb_common [last unloaded: scsi_wait_scan]Jul 15 16:47:53 xen1 kernel: [
955.374575]

Jul 15 16:47:53 xen1 kernel: [  955.374579] Pid: 3358, comm: flush-253:2 

Not tainted 3.2.0-4-amd64 #1 Debian 3.2.46-1 Gigabyte Technology Co., Ltd.
To be filled by O.E.M./970A-DS3

Jul 15 16:47:53 xen1 kernel: [  955.374590] RIP: e030:[<ffffffff810eba66>]
[<ffffffff810eba66>] cache_grow+0xef/0x217

Jul 15 16:47:53 xen1 kernel: [  955.374599] RSP: e02b:ffff8801b8b516e0
EFLAGS: 00010086

Jul 15 16:47:53 xen1 kernel: [  955.374603] RAX: ffff88013fc01000 RBX:
ffff8801df1cd800 RCX: 0000000000000000

Jul 15 16:47:53 xen1 kernel: [  955.374608] RDX: ffff88013fc01000 RSI:
000000000000000d RDI: 0000000000000000

Jul 15 16:47:53 xen1 kernel: [  955.374613] RBP: ffff8801df1c4340 R08:
ffff8801ebd7fe00 R09: 000000000000001d

Jul 15 16:47:53 xen1 kernel: [  955.374618] R10: 0000000000016677 R11:
0000000000016628 R12: 0000000000000000

Jul 15 16:47:53 xen1 kernel: [  955.374622] R13: 0000000000000000 R14:
ffff88013fc01000 R15: 0000000000000080

Jul 15 16:47:53 xen1 kernel: [  955.374631] FS: 00007f19a8994700(0000)
GS:ffff8801eba80000(0000) knlGS:0000000000000000

Jul 15 16:47:53 xen1 kernel: [  955.374636] CS:  e033 DS: 0000 ES: 0000 CR0:
000000008005003b

Jul 15 16:47:53 xen1 kernel: [  955.374640] CR2: ffff88013fc01020 CR3:
00000001dd274000 CR4: 0000000000000660

Jul 15 16:47:53 xen1 kernel: [  955.374646] DR0: 0000000000000000 DR1:
0000000000000000 DR2: 0000000000000000

Jul 15 16:47:53 xen1 kernel: [  955.374651] DR3: 0000000000000000 DR6:
00000000ffff0ff0 DR7: 0000000000000400

Jul 15 16:47:53 xen1 kernel: [  955.374656] Process flush-253:2 (pid: 3358,
threadinfo ffff8801b8b50000, task ffff8801dac0e7f0)

Jul 15 16:47:53 xen1 kernel: [  955.374662] Stack:

Jul 15 16:47:53 xen1 kernel: [  955.374664]  ffffffff810370cc
ffffffff00051200 ffff8801df1c4380 0000004000051200

Jul 15 16:47:53 xen1 kernel: [  955.374675]  0000000000001190
ffff8801df1cd800 0000000000000000 0000000000051200

Jul 15 16:47:53 xen1 kernel: [  955.374688]  ffff8801df1c4340
ffff8801df1d4800 000000000000003c ffffffff810eb828

Jul 15 16:47:53 xen1 kernel: [  955.374697] Call Trace:

Jul 15 16:47:53 xen1 kernel: [  955.374702] [<ffffffff810370cc>] ?
test_tsk_need_resched+0xa/0x13

Jul 15 16:47:53 xen1 kernel: [  955.374709] [<ffffffff810eb828>]
?____cache_alloc+0x1ae/0x1fa

Jul 15 16:47:53 xen1 kernel: [  955.374714] [<ffffffff810370cc>] ?
test_tsk_need_resched+0xa/0x13

Jul 15 16:47:53 xen1 kernel: [  955.374720] [<ffffffff8103ae6f>] ?
check_preempt_curr+0x52/0x5f

Jul 15 16:47:53 xen1 kernel: [  955.374726] [<ffffffff810eca2f>] ?
kmem_cache_alloc+0x58/0xea

Jul 15 16:47:53 xen1 kernel: [  955.374731] [<ffffffff810b695e>] ?
mempool_alloc+0x45/0xfa

Jul 15 16:47:53 xen1 kernel: [  955.374737] [<ffffffff810ea427>] ?
arch_local_irq_restore+0x7/0x8

Jul 15 16:47:53 xen1 kernel: [  955.374742] [<ffffffff810eca5d>] ?
kmem_cache_alloc+0x86/0xea

Jul 15 16:47:53 xen1 kernel: [  955.374748] [<ffffffff81120a06>] ?
bio_alloc_bioset+0x2b/0xb6

Jul 15 16:47:53 xen1 kernel: [  955.374758] [<ffffffffa00cac66>] ?
clone_bio+0x35/0xcb [dm_mod]

Jul 15 16:47:53 xen1 kernel: [  955.374767] [<ffffffffa00cb5d6>] ?
__split_and_process_bio+0x257/0x506 [dm_mod]

Jul 15 16:47:53 xen1 kernel: [  955.374774] [<ffffffff81355ddb>] ?
xen_hypervisor_callback+0x1b/0x20

 



Další informace o konferenci Linux