nagiosgraph & rrdtool

Miroslav BENES miroslav.benes na zdas.cz
Čtvrtek Červen 30 12:44:03 CEST 2005


Přeji krásný den !

Pokouším se na sledovací soft Nagios nasadit nadstavbu, která kromě 2b 
sledování stavu "dobrý/špatný/chcíplý/nevím" umí hodnoty změřené při 
testech ukládat do RRD databáze aa dělat z nich grafy. Je to udělanéí 
celkem elegantně, ale připadá mi, že se v grafech objevují nesmysly - a 
jak se zdá, v DB jsou taky.

Posuďte sami :

a) hodnoty zjištěné jádrem nagios-u (odchycené zformátované řetězce s 
hlášením, které dostane nagiosgraph) :
"1120125168||mx||SMTP||SMTP OK - 0,008 sec. response 
time||time=0,008488s;;;0,000000"
"1120125348||mx||SMTP||SMTP OK - 0,182 sec. response 
time||time=0,182371s;;;0,000000"
"1120125528||mx||SMTP||SMTP OK - 0,008 sec. response 
time||time=0,008142s;;;0,000000"
"1120125708||mx||SMTP||SMTP OK - 0,011 sec. response 
time||time=0,010848s;;;0,000000"
"1120125888||mx||SMTP||SMTP OK - 0,044 sec. response 
time||time=0,044133s;;;0,000000"
"1120126068||mx||SMTP||SMTP OK - 0,960 sec. response 
time||time=0,960464s;;;0,000000"
"1120126248||mx||SMTP||SMTP OK - 0,031 sec. response 
time||time=0,030697s;;;0,000000"
"1120126428||mx||SMTP||SMTP OK - 0,068 sec. response 
time||time=0,067819s;;;0,000000"
"1120126608||mx||SMTP||SMTP OK - 0,009 sec. response 
time||time=0,008911s;;;0,000000"
"1120126788||mx||SMTP||SMTP OK - 0,011 sec. response 
time||time=0,010986s;;;0,000000"

b) odpovídající obsah RRD databáze (zjištěno pomocí rrdtool dump xxx.rrd) :
<!-- 2005-06-30 11:55:00 CEST / 1120125300 --> <row><v> 1.8069172932e+02 
</v></row>
<!-- 2005-06-30 12:00:00 CEST / 1120125600 --> <row><v> 3.6560000000e+01 
</v></row>
<!-- 2005-06-30 12:05:00 CEST / 1120125900 --> <row><v> 6.8760000000e+01 
</v></row>
<!-- 2005-06-30 12:10:00 CEST / 1120126200 --> <row><v> 5.5124000000e+02 
</v></row>
<!-- 2005-06-30 12:15:00 CEST / 1120126500 --> <row><v> 4.7920000000e+01 
</v></row>
<!-- 2005-06-30 12:20:00 CEST / 1120126800 --> <row><v> 1.0320000000e+01 
</v></row>

Nechápu, kde ty časy sebral. I kdyby šlo o ms (tak jak se to zdá být v 
prvním případě, kdy bylo ohlášeno "0,182371s" a uloženo bylo "180,69"), 
pak hrubě neodpovídá na čtvrtém řádku hodnota 551,24, která 
nekoresponduje s žádnou z hodnot předaných zvenku.


Pro úplnost ještě odpovídající část konfiguráku "map", ve kterém jsou 
definice regulárních výrazů, které parsují vstup (zpracovává to skript v 
perl-u):

# Service type: unix-smtp
#   output:SMTP OK - 0.187 sec. response time
/output:SMTP.*?([-.0-9]+) sec/
and push @s, [ smtp,
               [ response, GAUGE, $1 ] ];



Díky za tipy.



Miroslav BENEŠ
System Administrator
ŽĎAS a.s.



Další informace o konferenci Linux