nagiosgraph & rrdtool

Libor Chocholaty libor_ml1 na mts.cz
Čtvrtek Červen 30 13:40:32 CEST 2005


Miroslav BENES wrote:

> Přeji krásný den !

I vam krasny podmracene destivy den :-)

>
> Pokouším se na sledovací soft Nagios nasadit nadstavbu, která kromě 2b 
> sledování stavu "dobrý/špatný/chcíplý/nevím" umí hodnoty změřené při 
> testech ukládat do RRD databáze aa dělat z nich grafy. Je to udělanéí 
> celkem elegantně, ale připadá mi, že se v grafech objevují nesmysly - 
> a jak se zdá, v DB jsou taky.
>
> Posuďte sami :
>
> a) hodnoty zjištěné jádrem nagios-u (odchycené zformátované řetězce s 
> hlášením, které dostane nagiosgraph) :
> "1120125168||mx||SMTP||SMTP OK - 0,008 sec. response 
> time||time=0,008488s;;;0,000000"
> "1120125348||mx||SMTP||SMTP OK - 0,182 sec. response 
> time||time=0,182371s;;;0,000000"
> "1120125528||mx||SMTP||SMTP OK - 0,008 sec. response 
> time||time=0,008142s;;;0,000000"
> "1120125708||mx||SMTP||SMTP OK - 0,011 sec. response 
> time||time=0,010848s;;;0,000000"
> "1120125888||mx||SMTP||SMTP OK - 0,044 sec. response 
> time||time=0,044133s;;;0,000000"
> "1120126068||mx||SMTP||SMTP OK - 0,960 sec. response 
> time||time=0,960464s;;;0,000000"
> "1120126248||mx||SMTP||SMTP OK - 0,031 sec. response 
> time||time=0,030697s;;;0,000000"
> "1120126428||mx||SMTP||SMTP OK - 0,068 sec. response 
> time||time=0,067819s;;;0,000000"
> "1120126608||mx||SMTP||SMTP OK - 0,009 sec. response 
> time||time=0,008911s;;;0,000000"
> "1120126788||mx||SMTP||SMTP OK - 0,011 sec. response 
> time||time=0,010986s;;;0,000000"
>
> b) odpovídající obsah RRD databáze (zjištěno pomocí rrdtool dump 
> xxx.rrd) :
> <!-- 2005-06-30 11:55:00 CEST / 1120125300 --> <row><v> 
> 1.8069172932e+02 </v></row>
> <!-- 2005-06-30 12:00:00 CEST / 1120125600 --> <row><v> 
> 3.6560000000e+01 </v></row>
> <!-- 2005-06-30 12:05:00 CEST / 1120125900 --> <row><v> 
> 6.8760000000e+01 </v></row>
> <!-- 2005-06-30 12:10:00 CEST / 1120126200 --> <row><v> 
> 5.5124000000e+02 </v></row>
> <!-- 2005-06-30 12:15:00 CEST / 1120126500 --> <row><v> 
> 4.7920000000e+01 </v></row>
> <!-- 2005-06-30 12:20:00 CEST / 1120126800 --> <row><v> 
> 1.0320000000e+01 </v></row>
>
> Nechápu, kde ty časy sebral. I kdyby šlo o ms (tak jak se to zdá být v 
> prvním případě, kdy bylo ohlášeno "0,182371s" a uloženo bylo 
> "180,69"), pak hrubě neodpovídá na čtvrtém řádku hodnota 551,24, která 
> nekoresponduje s žádnou z hodnot předaných zvenku.

podle me data, ktera nam ukazujete z RRD jsou uz consolidated data, 
ktera jsou agregovana z primary data points podle prislusne funkce (MIN, 
MAX, AVERAGE), takze to, ze nesouhlasi jeste nemusi nic neznamenat. Data 
z nagiosu mate s periodou 180s a data z RRD s periodou 5 minut (300 
sekund), takze bych "problem" hledal prave v te agregaci.

Libor




Další informace o konferenci Linux