Nagios+Cacti模块——NRPE监控linux本地信息(五)-创新互联

遇到问题:nagios监控远程主机linux的本地信息:如内存,cpu,负载等

创新互联建站是一家集网站建设,西盟企业网站建设,西盟品牌网站建设,网站定制,西盟网站建设报价,网络营销,网络优化,西盟网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

解决问题:NRPE监控信息

承接http://mengsir.blog.51cto.com/2992083/1254272 Nagios+Cacti模块——NRPE监控linux本地信息(四)

被监控机:

1.修改nrpe.cfg

vi/var/www/html/nagios/etc/nrpe.cfg    (这里假设1.2.3.4是监控服务器的ip地址)

allowed_hosts=127.0.0.1,1.2.3.4      //允许监控服务器访问,中间用逗号隔开。
server_address=1.2.3.4          // 以单独的守护进程运行

监控主机(nagios主机)

1.配置文件vi /var/www/html/nagios/etc/objects/commands.cfg末尾增加如下内容

define command
        command_name    check_nrpe
        command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
        }

意义如下:

command_name  check_nrpe

定义命令名称为check_nrpe,在 services.cfg中要使用这个名称

command_line  $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

这是定义实际运行的插件程序.这个命令行的书写要完全按照check_nrpe这个命令的用法.不知道用法的就用check_nrpe –h查看

2.在services.cfg中添加(/var/www/html/nagios/etc/object/services.cfg)

define service {
        host_name               test244-server
       service_description        check-load
        check_command           check_nrpe!check_load
        check_period            24x7
        max_check_attempts      3
        normal_check_interval   3
        retry_check_interval    2
        contact_groups          deyougroup
        notification_interval   10
        notification_period     24x7
        notification_options   w,u,c,r
}

3.手动在nrpe.cfg中添加,也就是自定义NRPE命令.

现在我们要监控swap分区,如果空闲空间小于20%则为警告状态—warning;如果小于10%则为严重状态—critical.我们可以查得需要使用check_swap插件,完整的命令行应该是下面这样.

/usr/local/nagios/libexec/check_swap -w 20% -c 10%

4.在被监控机上增加check_swap命令的定义

vi /var/www/html/nagios/etc/nrpe.cfg

增加下面这一行

command[check_swap]=/var/www/html/nagios/libexec/check_swap -w 20% -c 10%

现在check_swap 就可以作为check_nrpe 的 –c 的参数使用了。

修改了配置文件,当然要重启.但是如果你是以独立的daemon运行的nrpe,那么需要手动重启.如果你是在xinetd或者inetd下面运行的,则不需要.

由于我们是xinetd下运行的,所以不需要重启服务

5.有关于check_load的用法及意义

这个插件是用来检测系统当前的cpu负载,使用的方法为

check_load [-r] -w WLOAD1,WLOAD5,WLOAD15 -cCLOAD1,CLOAD5,CLOAD15

在unix里面负载的均值通常表示是1分钟,5分钟,15分钟内平均有多少进处于等待状态.

例如check_load -w 15,10,5 -c 30,25,20这个命令的意义如下

当1分钟多于15个进程等待,5分钟多于10个,15分钟多于5个则为warning状态当1分钟多于30个进程等待,5分钟多于25个,15分钟多于20个则为critical状态

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


分享文章:Nagios+Cacti模块——NRPE监控linux本地信息(五)-创新互联
标题链接:http://pwwzsj.com/article/dcgjej.html