サーバに監視ツールのNagiosをインストールしてみました。
ログの一部を抜粋
# yum -y install gd-devel
Complete!# useradd -d /usr/local/nagios/ -M nagios
## wget http://downloads.sourceforge.net/project/nagios/nagios-3.x/nagios-3.1 .0/nagios-3.1.0.tar.gz(本体DL)
`nagios-3.1.0.tar.gz’ を保存しました [2724545/2724545]
tar zxvf nagios-3.1.0.tar.gz
# cd nagios-3.1.0
wget http://jaist.dl.sourceforge.jp/nagios-jp/38828/nagios-3.1. 0-ja-utf8.patch.gz(日本語パッチDL)
`nagios-3.1.0-ja-utf8.patch.gz’ を保存しました [127436/127436]
# gzip -dc znagios-3.1.0-ja-utf8.patch.gz |patch -p0
#./configure && make all && make fullinstall && make install-con fig(インストール)
インストールを完了しましたが、起動してみるとMemory Freeの項目が異常を示していました。
logを調べたり色々検索してみたところ、プラグインのcheck_mem.plに実行権限が与えられていなかった模様です。
# chmod +x /usr/local/nagios/libexec/check_mem.pl
ちなみに調べている時にMemory Freeが本当に10%切っていたのでそちらも対処しました。
原因はメモリーのキャッシュが解放されていなかったようで、ページキャッシュを開放することで正常な数値になりました。
#vmstat
procs ———–memory———- —swap– —–io—- –system– —–cpu——
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 54444 37768 48156 355968 0 0 28 5 1 3 1 0 97 2 0
# echo 1 > /proc/sys/vm/drop_caches
# vmstat
procs ———–memory———- —swap– —–io—- –system– —–cpu——
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 54444 429260 248 16368 0 0 28 5 1 3 1 0 97 2 0
現在は異常なし。
このドタバタでアラートの類がメールサーバを通して送られてくることも確認しました。
これでサーバにログインしなくても大雑把な状態は把握できるはずです。
そこまでやる程のサーバでもない気はしますが・・・