vysoky load (delsi)
Ludek Finstrle
luf na gvid.cz
Pondělí Září 2 00:01:00 CEST 2002
Ahoj,
mam nasledujici problem na jednom dvouprocesorovem stroji. Donedavna
vse bylo v naproste pohode. Vecne mel stroj load 0.00, ale asi pred 3
dny jsem zjisitl, ze load neklesa pod 0.7. Pritom jsem zkusil spoustu
veci a nic nepomahalo.
Konfigurace: 2x AMD K7 1200MHz, 1024MiB pameti, 4 disky (kazdy je single
na svym kanale), RH7.2 s updaty z errata, jadro 2.4.18+xfs patche.
Nejsem si vedom zadnych zmen v dobe, kdy se to zaclo chovat podivne.
Zkusil jsem i s pomoci RPM zkontrolovat, zda jsem nebyl navstiven, ale
nebyl dle vysledku.
Nyni poslu par vypisu, co jsem z toho stroje vzal po 10 minutach, kdy jsem
mimo ssh stopl snad vsechno:
bash$ ps axf
PID TTY STAT TIME COMMAND
7 ? SW 0:02 [kupdated]
6 ? SW 0:00 [bdflush]
5 ? SW 0:00 [kswapd]
4 ? SWN 0:00 [ksoftirqd_CPU1]
3 ? SWN 0:00 [ksoftirqd_CPU0]
1 ? S 0:05 init
2 ? SW 0:00 [keventd]
8 ? SW 0:00 [pagebuf_daemon]
9 ? SW< 0:00 [mdrecoveryd]
10 ? SW< 0:00 [raid1d]
11 ? SW< 0:00 [raid1d]
12 ? SW< 0:00 [raid1d]
13 ? SW< 0:00 [raid1d]
14 ? SW< 0:00 [raid1d]
15 ? SW< 0:00 [raid1d]
16 ? SW< 0:00 [raid1d]
17 ? SW< 0:00 [raid1d]
609 ? SW 0:00 [eth1]
907 ? S 0:00 /usr/sbin/sshd
2484 ? S 0:00 \_ /usr/sbin/sshd
2485 pts/0 S 0:00 \_ -bash
3438 pts/0 R 0:00 \_ ps axf
1318 tty2 S 0:00 /sbin/mingetty tty2
1319 tty3 S 0:00 /sbin/mingetty tty3
1320 ? S 0:00 /opt/sbin/faxgetty /dev/modem
3406 ? S 0:00 minilogd
bash$ uptime
11:37pm up 51 min, 1 user, load average: 0.98, 0.94, 0.82
bash$ free
total used free shared buffers cached
Mem: 1029344 251752 777592 0 80 183192
-/+ buffers/cache: 68480 960864
Swap: 2097136 0 2097136
bash$ top
11:37pm up 51 min, 1 user, load average: 0.98, 0.94, 0.82
26 processes: 25 sleeping, 1 running, 0 zombie, 0 stopped
CPU0 states: 0.0% user, 0.0% system, 0.0% nice, 100.0% idle
CPU1 states: 0.0% user, 0.0% system, 0.0% nice, 100.0% idle
Mem: 1029344K av, 251872K used, 777472K free, 0K shrd, 80K buff
Swap: 2097136K av, 0K used, 2097136K free 183192K cached
PID USER PRI NI SIZE RSS SHARE STAT %CPU %MEM TIME COMMAND
1 root 4 0 512 512 440 S 0.0 0.0 0:05 init
2 root 9 0 0 0 0 SW 0.0 0.0 0:00 keventd
3 root 18 19 0 0 0 SWN 0.0 0.0 0:00 ksoftirqd_CPU0
4 root 19 19 0 0 0 SWN 0.0 0.0 0:00 ksoftirqd_CPU1
5 root 9 0 0 0 0 SW 0.0 0.0 0:00 kswapd
6 root 9 0 0 0 0 SW 0.0 0.0 0:00 bdflush
7 root 9 0 0 0 0 SW 0.0 0.0 0:02 kupdated
8 root 9 0 0 0 0 SW 0.0 0.0 0:00 pagebuf_daemon
9 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 mdrecoveryd
10 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
11 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
12 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
13 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
14 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
15 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
16 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
17 root -1 -20 0 0 0 SW< 0.0 0.0 0:00 raid1d
Pri vyspisu /proc/mdstat se tvari vse ok, ze nic nedela. Sit taky nema zadny
obrovsky tok (<1Mib/s)
Predem dekuji za jakekoli nakopnuti, kde dal hledat
Luf
P.S. Na vykon stroje to snad ani vliv nema (aspon jsem si nevsiml).
Další informace o konferenci Linux