服务器监测(服务器监测框架)

admin 123 2022-10-19

阿里云服务器优惠多,折扣错,惊喜多,请咨询:www.wqiis.com

本文目录一览:

有什么监控Linux服务器的工具吗?

1、Ganglia

是一个集群监控软件,可以监视和显示集群中的节点的各种状态信息,比如:CPU、mem、硬盘利用率、I/O负载、网络流量情况等,同时可以将历史数据以曲线方式通过php页面呈现,此软件主要是用来监控系统性能的软件,通过曲线可以很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。

它是分布式的监控系统,有两个Daemon,是一个Linux下图形化监控系统运行性能的软件,界面美观、丰富,功能强大。

RRDtool是系统存放和显示time-series (即网络带宽、温度、人数、服务器负载等) 。并且它提出有用的图表由处理数据强制执行有些数据密度。

2、Cacti

是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具,通过snmpget来获取数据,使用RRDTool绘画图形,提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结 构、host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,功能非常强大完善。

cacti是用php语言实现的一个软件,它的主要功能是用snmp服务获取数据,然后用rrdtool储存和更新数据,当用户需要查看数据的时候用rrdtool生成图表呈现给用户。因此,snmp和rrdtool是cacti的关键。

3、Zenoss

是一款智能监控软件,允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core同时也是开源的网络与系统管理软件。

Zenoss提供功能丰富的产品,以监测整个IT基础设施:

网络 -路由器,交换机,防火墙,接入点;

服务器 -微软的Windows , Linux , Unix系统,惠普, NetApp,戴尔;

虚拟化 -完整虚拟机虚拟化基础架构( VI3 )管理, XenSource监测;

应用领域 -Process(程序),Port,网络应用服务, Web服务,数据库,中间件,商业企业应用方案 ;

4、Argus

是一个网络连接监控器,可以利用它来定制监控网络中符合某种条件的计算机,例如网络空闲、断开等。

5、Monit

是一款功能非常丰富的进程、文件、目录和设备的监测软件,用于UNIX平台,可以自动修复那些已经停止运行的程序,适合处理那些由于多种原因导致的软件错误。

6、Nagios

是一个监视系统运行状态和网络信息的监视系统,能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。

Nagios的主要功能特点:

监视网络服务(SMTP、POP3、HTTP、NNTP、PING等);

监视主机资源(进程、磁盘等);

简单的插件设计可以轻松扩展Nagios的监视功能;

服务等监视的并发处理;

错误通知功能(通过email、pager或其他用户自定义的方法)。

怎样监测一个windows服务器

Windows服务器的监控方式有三种,分别为Agent监测方式、SNMP监测方式和WMI监测方式,下面分别对每一种监测方式进行介绍:

Agent监测方式

使用Agent方式来采集数据,首先需要在被监测服务器上安装Windows Agent代理程序,安装过程请参考安装Agent代理。

1、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮,再点击左下方的【设备管理】。右键点击【设备管理】树下的【设备列表】,弹出菜单。

(也可在设备列表的空白处【图标视图】和【详细信息】中右键选择【增加管理对象】或在快速工具栏中点击【增加管理对象】,下同)

2、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下看到“AgentWindows”。

选中上图中的【AgentWindows】,点击【确定】,弹出【AgentWindows】对话框,如下图所示(也可左键双击【AgentWindows】弹出下面对话框)。

3、在“基本设置”栏下进行设置:

Windows服务器地址:输入被监测的服务器的IP地址

Agent端口号:Agent端口,默认为2198

标题:填写显示的标题,可以自己定义

是否禁止:禁止则不进行监测

监测服务器:默认即可

4、在“高级设置”栏可以对该管理对象进行详细描述以及设置依靠条件,如下图:

依靠:从下拉列表中选择要依靠的监测点,可以设置多个监测点依靠。

描述:填写对该设备的简单描述,可以不填写。

5、“基本设置”和“高级设置”填写完毕,点击【确定】即可,弹出显示正在获取管理对象属性提示框。如果获取正常,就会弹出【配置监测点】对话框。

勾选要监测的选项后,点击右边的【确定】即可,Agent监测方式添加完成。添加完成后,在【设备管理】的树下和设备列表的图标视图中都会有添加的设备显示。

SNMP监测方式

注意:如果采用SNMP方式监控,请检查远程机器的SNMP协议是否打开 。

1、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮。

再点击左下方的【设备管理】,如下图所示:

2、右键点击【设备管理】树下的【设备列表】,弹出菜单,如下图所示:

3、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下选择设备类型为“SNMP Windows”,点击【确定】,如下图所示:

4、选择“SNMP Windows”,点击【确定】后,弹出如下图所示对话框:

5、“基本设置”选项卡:

Windows服务器IP:填写被监测服务器的IP地址

SNMP端口号:填写SNMP的端口号

可读共同体名称:填写SNMP的可读共同体名称

标题:填写显示的标题

监测服务器:默认即可

6、“高级设置”选项卡:

该选项卡中的设置和Agent中的设置相同。

点击【确定】后,SNMP Windows的监测方式添加完成。添加完成后在设备管理中设备列表下和右侧【设备列表】的图标视图中都会有该设备。

WMI监测方式

注意:如果用WMI方式,需要安装WMI和服务

1、用WMI方式监测,需要将CreCloud Task Server 服务改为用管理员用户启动。

CreCloud Task Server 服务右键“属性”,选择“登录”选项卡

登录帐户选择“此帐户”,点击“浏览”按钮,弹出“选择用户”窗口

点击“高级”按钮后,点击“一般性查询”右侧的“立即查找”按钮,在下方查询结果中选择“Administartor”用户后确定

返回到属性窗口,点击确认,并重启CreCloud Task Server服务

2、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮。

再点击左下方的【设备管理】,如下图所示:

3、右键点击【设备管理】树下的【设备列表】,弹出菜单,如下图所示:

4、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下选择设备类型为“WMI Windows”,点击【确定】,如下图所示:

点击【确定】后,弹出如下图对话框:

5、“基本设置”选项卡

Windows服务器IP:填写被监测的服务器的IP地址

登录名:填写被监测的服务器的系统管理员名称

登陆密码:填写被监测服务器的系统管理员密码

标题:填写显示的标题

6、“高级设置”选项卡中设置和以Agent、SNMP方式中的设置相同。

7、点击【确定】后,WMI Windows的监测方式添加完成,完成后会在设备管理中设备列表下和右侧【设备列表】的图标视图中都会有该设备。

如何监测windows服务器的性能

Windows服务器中自带的性能监控工具叫做Performance Monitor;

在开始-运行中输入‘perfmon’,然后回车即可运行。

Monitor本身也是一个进程,运行起来也要占用一定的系统资源。所以你看到的资源的使用量应该比实际的要稍微高一点。这个工具在帮助管理员判断系统性能瓶颈时非常有用;

举个列子来说,今天有个用户抱怨说他们项目组的服务器(这是一台虚拟机)运行起来非常慢,但也不知道具体问题出在什么地方。任务管理器里显示CPU和内存的使用量都不算高,但服务器的相应就是非常慢;

Monitor,让其运行一段时间后(因为参考平均值会比较准确),发现average disk queue的值比较高,这就说明物理服务器的硬盘负荷太重,I/O操作的速度跟不上系统的要求。关掉虚拟机,将其转移到另一台硬盘负载比较小的主机上,再打开虚拟机。

分析性能情况

1、内存泄露判断

虚拟内存字节数(VirtualBytes)应该远大于工作集字节数(Workingset),如果两者变化规律相反,比如说工作集增长较快,虚拟内存增长较少,则可能说明出现了内存泄露的情况。

对于Workingset、Private Bytes、Available bytes这些计数器,如果在测试期间内数值持续增长,而且测试停止后位置在高水平,则也说明存在内存泄露。

Windows资源监控中,如果Process\PrivateBytes计数器和Process\WorkingSet计数器的值在长时间内持续升高,同时Memory\Available

bytes计数器的值持续降低,则很可能存在内存泄漏。

2、CPU使用情况

一般平均不要超过70%,最大不要超过90%(好:70% 、坏:85%、 很差:90%)。

3、tps(每秒处理事务的数量,在SOAPUI中进行统计)

一般在10-100,不同应用程序具体值不同。

怎么用Nagios监测Windows服务器

监控主机配置:redhat linux as4,nagios3

被监控主机:Windows Server 2008 R2 Enterprise,nsclient++0.4.4.172

Nagios是一款开源的免费网络监视工具,其功能强大,灵活性强。能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。nagios监控windows系统有三种实现方式:SNMP、NSClient++、NRPE。

下面介绍使用NSClient++方式来监控Windows:

首先在windows下安装nsclient++,运行NSCP-0.4.0.172-x64.msi安装文件,一步一步往下走,其中需要设置nagios监控主机IP和NSClient密码(值当使用check_nt时使用),如图1所示:

Allowed hosts:填写nagios监控主机IP

NSClient Password:当使用命令check_nt时需要设置密码,根据自己情况设置

Module to load:根据自己的需要选择相应的模块

安装完毕以后,打开windows服务管理器,查看nsclient服务是否启动,如图2所示:

然后在nagios监控主机上面进行相关的配置,主要涉及两个配置文件nagios.cfg和windows.cfg

(1) 因为nagios是模块化调用,先到配置文件打开windows相关模块,编辑nagios.cfg文件

[root@localhost etc]# ls

cgi.cfg htpasswd nagios.cfg nrpe.cfg objects objects.bak objects.tar resource.cfg

[root@localhost etc]# pwd

/usr/local/nagios/etc

[root@localhost etc]# vi nagios.cfg

将#cfg_file=/usr/local/nagios/etc/objects/windows.cfg该行前面的#注释去掉即可.

(1) 修改windows.cfg配置文件,需要修改define host和define service两部分

# Define a host for the Windows machine we'll be monitoring

# Change the host_name, alias, and address to fit your situation

define host{

use windows-server ; Inherit default values from a template

host_name video4-beijing ; The name we're giving to this host 被监控主机的主机名

alias video4-beijing ; A longer name associated with the host

contact_groups sa ;

address 10.12.4.169 ; IP address of the host 被监控主机的IP

}

# Create a service for monitoring CPU load

# Change the host_name to match the name of the host you defined above

define service{

use generic-service

host_name video4-beijing

service_description CPU Load

check_command check_nt!CPULOAD!-l 5,80,90

contact_groups sa

}

# Create a service for monitoring

# Change the host_name to match the name of the host you defined above

define service{

use generic-service

host_name video4-beijing

service_description Memory Usage

check_command check_nt!MEMUSE!-w 80 -c 90

contact_groups sa

}

# Create a service for monitoring C:\ disk usage

# Change the host_name to match the name of the host you defined above

define service{

use generic-service

host_name video4-beijing

service_description C:\ Drive Space

check_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90

contact_groups sa

}

修改完相关的配置文件以后,执行如下命令检查配置文件是否正确:

[root@localhost objects]# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

遇到的问题,在检查配置文件时错误信息如下:

Checking services...

Error: Contact group 'admins' specified in service 'C:\ Drive Space' for host 'video4-beijing' is not defined anywhere!

Error: Contact group 'admins' specified in service 'Explorer' for host 'video4-beijing' is not defined anywhere!

Error: Contact group 'admins' specified in service 'Memory Usage' for host 'video4-beijing' is not defined anywhere!

Checked 14 services.

Checking hosts...

Error: Contact group 'admins' specified in host 'video4-beijing' is not defined anywhere!

Checked 7 hosts.

Checking host groups...

Checked 2 host groups.

Checking service groups...

Checked 0 service groups.

Checking contacts...

Checked 1 contacts.

Checking contact groups...

Checked 1 contact groups.

Checking service escalations...

Checked 0 service escalations.

Checking service dependencies...

Checked 0 service dependencies.

Checking host escalations...

Checked 0 host escalations.

Checking host dependencies...

Checked 0 host dependencies.

Checking commands...

Checked 25 commands.

Checking time periods...

Checked 5 time periods.

Checking for circular paths between hosts...

Checking for circular host and service dependencies...

Checking global event handlers...

Checking obsessive compulsive processor commands...

Checking misc settings...

Total Warnings: 0

Total Errors: 4

*** One or more problems was encountered while running the pre-flight check...

Check your configuration file(s) to ensure that they contain valid

directives and data defintions. If you are upgrading from a previous

version of Nagios, you should be aware that some variables/definitions

may have been removed or modified in this version. Make sure to read

the HTML documentation regarding the config files, as well as the

'Whats New' section to find out what has changed.

以上问题的原因是因为一开始在windows.cfg文件中定义host和service时没有增加contact_groups sa这个字段,host和service默认所在的contact_group为admins,而我的nagios监控主机contacts.cfg文件中配置的contactgroup为sa。

服务器监测的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于服务器监测框架、服务器监测的信息别忘了在维启网络进行查找喔。

上一篇:关于服务器系统升级需要多长时间的信息
下一篇:什么是刀片服务器(刀片服务器用途)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~