[Pandora-jp] 監視データの取り込み遅延に遭遇・・・

Junichi Satoh junichi @ pandorafms.jp
2017年 1月 27日 (金) 18:00:33 JST


さとうです。

> 既存環境:Pandora_FMS OSS版 4.0.3 [open-suse]を運用中です。
> 
> 監視情報)
>  エージェント数:275
>  モニター項目:1741
>  アラート定義:2064
> 
> パフォーマンス設定情報)
>  添付ファイルでご確認下さい。
> 
> サーバスペック)
>  CPU:Intel(R) Xeon(R) CPU X5260  @ 3.33GHz X2 (仮想環境)
>  MEM:12GB
> 
> ここ数ヶ月ですが、監視データの取り込み遅延に遭遇しております。
> サーバリソースも見ています。ロードアベレージ値が常に、4.xx〜8.xx
> あたりで推移しており、高負荷状態が続いたままと捉えていますが・・・
> 
> Pandoraの性能として、確か4監視台数=4000台と記憶しておりましたが
> 間違では無いでしょうjか?
> 
> また、アラート通知メールも時折、送信せずの状態も見受けられますので
> この状態では監視運用に支障を来すと考えつつあります。
> 稼働バージョンもだいぶ古くなりつつあるので、この機会に最新OSS版に
> 切替ていこうかと考えますが、次の項目で疑問がありますのでご回答
> 頂けてたら助かります。
> 
>   1.最新バージョンにしたら、上記の不具合は解決される可能性が
>    あるのでしょうか? それともOSS版だから性能差がある?
使われている Pandora FMS のバージョンが 4.0.3 とのことなので、
それに比べれば、最新版では(主にコンソールで)パフォーマンス周りの
改善もされてます。とはいえ、遅延が発生しているとのことなので、それは
pandora_server 側の処理であり、劇的に変わるほどではないでしょう。

>   2.エージェント数=275くらいで、遅延やロードアベレージ値の上昇に
>    悪影響が発生するのでしょうか?
"仮想環境" と書かれていたので、サーバのリソース 100% を Pandora
のサーバで利用できる状態なのかどうかはわかりませんが、使えると
するならば、一般的には 275エージェントくらいは難なく監視できるレベル
だと思います。

>   3.サーバリソースの最適値はどのくらいなのでしょうか?
監視内容や各モジュールの実行頻度にもよります。

Pandora FMS の監視で遅延が発生する場合、Pandora FMS 自体よりも、

  . DB のチューニングができていない
  . ディスク I/O が遅すぎ

ということに起因することの方が多いです。

DB に関しては、以下を参考にしてみると良いと思います。
http://wiki.pandorafms.com/index.php?title=Pandora:Documentation_ja:Optimization

ディスク I/O については、仮想環境とのことなので、もし他の仮想サーバが
同じ物理サーバにのっていて、ディスク I/O を圧迫しているような環境だと
すると、Pandora FMS の処理遅延につながる可能性はあります。

---
佐藤 淳一
junichi @ pandorafms.jp


Pandora-jp メーリングリストの案内