《Zabbix应用常见问题和故障解决方法.docx》由会员分享,可在线阅读,更多相关《Zabbix应用常见问题和故障解决方法.docx(17页珍藏版)》请在课桌文档上搜索。
1、查看zabbix_server.log,提示以下问题cannotsendlistofactivechecksto10.200.4.150:hostWIN-FKL6C0EFHBTnotfound其实在ZabbiXWeb上是有agent主机最新数据的,出现上面的问题是因为Web和agent配置的HOStname对不上,但是agent主机是有配Serverip的,所以也可以请求到数据。处理也比较简单,2边改为一致的,方便记忆的名字,然后重启agent服务就行了:英文版:DOeSnotsupportUsorParametersOrali中文版:SnmP方式采集IinUX数据,只能获取到系统的基本信息,
2、其他却提示NoSuchObjectavailableonthisagentatthisOID解决方法:在目标主机编辑SnmPd.conf文件,加上viewsystemviewincluded.1#意思是允许访问System所有的oid节点信息然后重启servicesnmpdrestartgOupNamesecurItyModelSecuiityNamegroupnotConfigGroupvlnotConfigUsergroupnotConfigGroupv2cnotConfigUser# Third,createaviewforustoletthegrouphaverightsto:# Ma
3、keatleastsnmpwalk-v1Iocalhost-cpublicsystemfastagain.PnoneNnTlucl1subtreemask(optional)viewsystemviewincluded.1viewsystemviewincludedT73.6.1.2.1.1viewsystemviewincluded.1.3.6.1.2.1.25.1.1没开改配置前的SnmPWalk到的信息,只能得到系统常见的几个数据。rootZabbixServersnawalk-v2c-cSNMPv2-MIB:zsysDev2MIB:IsysObjectID.三01D:NEr-SNMP-
4、ICulinuxDisman-EVENT-NIB:syspTMelnstce三ISticks:(33246:8:33.24SHMPv2KIB:sysContact.eSTRING:Root(configure/etc/snap/SnalP.localOnf)SMMPv2.MIB:$ysNae.eSTRING:yktroc2SHMPV2MIB:SySLOCdtion.6STRING:Unknown(editetcnapnpd.conf)SHMPv2MIB:SysORLestChange.TiiBeticks:(4)8:00:00.04SHMPv2-MIB:$y%0RID.lOID:SNMPMPO
5、MIB:z%pMPDMI80bjts.3.1.1SNMPv?.MIB:$y$0RI0.2OID:SNMP-USER-BAStD-SM-MIB:ZUMMIBCaBpUanceSMMPv?-MIB:sy%0RID.3*OID:SNMP-rRAM11K)RK-MI:MBpFraneworkMIBC三pUareSNMPv2-MIB:$yv(ID.4三OID:SNMPv2-MIB:%rwpMIBSNMPv2-MIB:sysORID.5三OID:TCP-MIB:UpHIBSNMPv2-MIB:sysORID.6OID:IP-HIBnipSWMPv2-HIB::5yiORID.7三OID:UDP-MIB:u
6、atching.SWMRv2MIB:sysOWescr.2STRING:TheMlBforHessogeProcessingendDisatching.SNMPv2RIB:sysOKecr.3STRING:TheSNMPHdnagementArchitectureMIB.SHMPV2ZIB:SyS(Xoescr.4STRING:TheMIBnoduleforSMMPV2entitiesSWMfxv2MI8:ry0RDecr.5STRING:TheMIBnoduleforMndgingTCPUBpleeentotionsSxMPV2MIB:SySoW)escr6STRING:TeMIBaodul
7、9forBanegingIPendICMPIBplceientationsSMMPv2MI:ysOROescr.7STRING:TheMlBnoduleforBanagingUDPapleBentdtionsSHMPv2MIB:yO(Oescr.8STRING:Vi.5三Tieeticks:4SNMPv2-MIB:sysOUpTi.6三TiBeticks:(4)z.4SNMPV2HB:SySOwjPTie.7Thwticks:(4)9:06:00,64SNMPv2Kl:ysOWpTie.8Ti*etick:(4)0:66:06,04(K)SI-RtSOURCtS-HI8:hrSytUptie,
8、0Tetic:3day,rOSTSOURCESMl:hr$y$tiUptiie.0sorevariablesletinthisHfView(tispattheendoftheMI6tree!改了之后获取到的系统信息,可以看到已经能获取支持的所有数据了I rootfZabbIxServer -J# SnMpWaIk -v 2c -c . mm SNMPv2-MIB:sysDescr.6 STRING: Linux2.6.32-573.el6.x86_64 tl SMP Wed Jul1 18:23:37 EDT 2015 x86_64SNHPv2-HIB:SysObjectID.O = OID:
9、 NET-SNMPTC:linoxDISMAN-EVENT-MIB:sysUpTieInstace = TiJBetiCk5: (2777 6:06:27,77SNMPv2-MI:$y$Contact.O STRING: Root (configure /etc/snap/snap.I ocal.cof)SNHPv2-HIB:rsysNae.0 STRING: yktrac2SNMPv2MIB:zsysLocation. STRING: Unknown (edit etcnapsmapd.conf)SNMPv2-MlB:SysORLastChange.0 UBeticks: (5) 0:00:
10、00,05SNMPV2MIB:SySoRlD.1 SNMPv2-MIB:syS0RID.2 SNKPv2-Hl:sy$0RID.3 SNMPv2-MIB: :$y$0RW,4 SNMPv2M!B:sy$0R1D.5 SNNPv2MI:sy50RID.6 SNNPv2-MI:$y$0RID.7 SNHPv2MIB:$y$0RI0.8 OID: OID: OID: 01D: OID: OID: OID: 01D:SNMPv2-MIB:SysORDescr.1 STRING: TheSNHPMPDMIB:MwpMfWIlBObjects.3.1.1SNHP.USER-BASEO-SH-M1B: Wl
11、BcalPliMCeSNMP-FRAMEWORK-Mie: ZsmapF reworkMIC(MplianceSNMPV2FI8: : SnmPmBTCP-KlB:tcpH18IP-MIB:ipUDP-HIB:udpMI8SNMP- VIEWBASED-AOIVIB: VXHBOSiCGr(MJPSNMPv2MIB:$ysORDesc r.2 STRING: SNNPv2MI:sysORDesc r,3 STRING: SNNPv2MIB:sysOW)esc r.4 STRING: SNMPv2-MIB:y0RDescr.5 STRING: SNKPV2NIB: ORgMr.6 STRING:
12、The The The Tbe TheMIB for MeSSOge Processing and Dispatching. MI8 for Hes509e Processing and Dispatching. SMMP Kn09cmet Architecture MI8.Ct 1(DSSNNPv2MIB:$yORD$c r.7 STRING: SNMPv2MIB::5y50RDc%c r.8 STRING:SNHPv2-NIB:zy50RUpTx*e.1-SNMPv2-MIB:zy0RUpTie.2 SNMPv2MIB:yORUpT ie.3 SNNPv2MIB:ysORUpT iae.4
13、SNMPv2-MIB:SysORUpTime.5 SNNPv2-MIB:ry0RUpTi*e.6 SNMPv2-NIB:SysORUpTime.7 SNMPv2-MIB:sysORUpTie.8 IF-NIB-ItNiMbef .0 INTEGK: 8 IF-MIB:ifIndex.1 = INTEGER: 1 IhMIBiiUndEx; = INTEGER: 2MIB module MIB (module MIB oduleTheMIB modulefor SMMPV2 entitiesfor managing TCP iaplntat ionsfor *anoging IP end ICM
14、P iaplmentfor *dnaginq UDP iapl*MO1*7001OOwrvrzcDO1*7OO1QOI、Zabbix是怎么实施监控的?一个监控系统运行的大概的流程是这样的:agent需要安装到被监控的主机上,它负责定期收集各项数据,并发送到zabbixserver端,zabbixserver将数据存储到数据库中,zabbixWeb根据数据在前端进行展现和绘图。这里agentd收集数据分为主动和被动两种模式:主动:agent请求SerVer获取主动的监控项列表,并主动将监控项内需要检测的数据提交给server/proxy被动:SerVer向agent请求获取监控项的数据,agen
15、t返回数据。主动监测通信过程如下:zabbix首先向SerVerACtiVe配置的IP请求获取activeitems,获取并提交activetiems数据值SerVer或者ProXyo很多人会提出疑问:ZabbiX多久获取一次activeitems?它会根据配置文件中的RefreShACtiVeCheCkS的频率进行,如果获取失败,那么将会在60秒之后重试。分两个部分:获取ACTIVEITEMS列表Agent打开TCP连接(主动检测变成Agent打开)Agent请求items检测列表Server返回items歹U表Agent处理响应关闭TCP连接Agent开始收集数据主动检测提交数据过程如下:
16、Agent建立TCP连接Agent提交items列表收集的数据SerVer处理数据,并返回响应状态关闭TCP连接被动监测通信过程如下:SerVer打开一个TCP连接Server发送请求agent.pingnAgent接收到请求并且响应Server处理接收到的数据关闭TCP连接I、新建监控项目时,选择的是ZabbiX代理还是zabbix端点代理程式(主动式),前者是被动模式,后者是主动模式。2、agentd配置文件中StartAgentS参数的设置,如果为0,表示禁止被动模式,否则开启。一般建议不要设置为0,因为监控项目很多时,可以部分使用主动,部分使用被动模式。2、Zabbix自动发现是怎么做
17、的?zabbix发现有3种类型:1自动网络发现(Networkdiscovery)2主动客户端自动注册(Activeagentauto-registration)3、低级别发现(IOW-IeVeIdiSCOVery)自动发现的做法:1、首先需要在模板当中创建一个自动发现的规则,这个地方只需要一个名称和一个键值。2、过滤器中间要添加你需要的用到的值宏。3、然后要创建一个监控项原型,也是一个名称和一个键值。4、然后需要去写一个这样的键值的收集。自动发现实际上就是需要首先去获得需要监控的值,然后将这个值作为一个新的参数传递到另外一个收集数据的item里面去。3、ZabbiX监控的客户端是怎么进行批量
18、安装的?推荐使用AnSibIe等自动化软件来进行批量安装。将安装过程编写执行脚本,然后再使用Ansible来进行批量安装。1、使用命令生成密钥。2、将公钥发送到所有安装ZabbiX客户端的主机。3、安装ansible软件,(修改配置文件,将ZabbiX客户机添加进组)。4、创建一个安装zabbix客户端的脚本。5、执行该脚本。6、验证。4、Zabbix4.0中有些报警不会立即触发报警邮件,这种问题该如何排查?【问题描述】手动关闭问题时却会立即发送报警邮件,比如更改hostname,监控项中信息类型为字符或文本会出现这种情况。建议按照触发器描述查下triggers表,按照triggerid查fu
19、nction表,确认表达式和监控项有没有问题,如果确定没问题的话查下event表,看看触发器是否生成事件,看事件后面的actionid和mediaid确定是否发出了报警并通知。5、ZabbiX可以监控端口带宽速度限制吗?根据实际操作经验是不能获取到带宽速度限制的参数的,如果使用qos的话,监控是没有办法获取到数据的,而且qos是动态的,更难监控,目前我们常用的方法是有固定带宽,比如总行和各支行及网点的数据传输,带宽是固定的,我们设置一个准确值给他,然后用实时带宽对比这个设置值,确定当前带宽占用的比率。上面的方法可以让你看到带宽的占用情况,如果你是为了解决带宽占用告警的问题,那么就需要采用动态基
20、线,动态阈值的方式来实现监控,避免告警风暴的出现,但是这涉及到页面的开发,和算法的研究,然后呈现出动态的告警,目前zabbix应该没有办法实现。6、自动化运维系统建设中,监控经常会用到Zabbix,那么使用它监控常用关系型数据库DB2、OracleMySQLSQLServer时,有什么比较全面的监控模板?Oracle可以使用OmbbiX插件监控,动手能力强的可以通过ODBC去监控。MySQL可以使用PerCona提供的一个模板监控,动手能力强的可以用sheikPython自行监控。补充下:目前我们基于Zabbix对Oracle、mysql和SQLServer都监控了:Oracle可以用Orab
21、bix,不过OrabbiX软件很久没更新,对于新的Oracle版本可能支持不好,对RAC环境也没有现成的配置文件。不好OrabbiX好处是可以自己定义监控项(通过定义获取监控的SQL语句),譬如可以根据需要增加阻塞监控、表空间使用率等监控SQLServer一般是通过读取WindoWS性能计数器来获取监控数据,需要解决同一台服务器多实例问题MySQL目前是通过ZabbiX的自定义监控项实现,执行Shen脚本7、Zabbix配置了IPV6的地址,怎么样可以监控到网外的某一个IPV6地址的网络质量?1 .如仅是到探测给地址网络质量,可使用Ping探测,设定探测周期及阈值,如:设定探测间隔为1s,当延
22、时连续3次大于50ms则触发报警;2 .如涉及到该地址的具体服务,可以使用具体协议,如tcp/udp,telnet/http请求来作为具体探测方式;注:此类探测工具,ZabbiX官方可以下载到相应模板,导入现有系统做自定义修改后即可使用。8、ZabbiX.server正常运行,却提示服务器没有运行的解决办法Zabbix突然出现了:Zabbixserverisnotrunning:theinformationdisplayedmaynotbecurrentZabbix服务器没有运行:显示的信息可能不是当前的I*n11变心IIS11*4IZtbbixMrWnotrunningtwMonmelion
23、dhptoydmyntbeOmnt一、SELinux未关闭selinux一定要关闭,如果开启selinux,可能zabbix的discovery都不能正常使用关闭selinux方法:1、修改etcselinuxConfig文件中的SELINUX=值为disable,然后重启。2、如果不想重启,使用SetenfOrCeOSetenfbrce1,selinux为enforcing模式Setenfbrce0,selinux为permissive模式二、zabbixweb目录下面,$ZBX_SERVER是否为IP,如果是IoCalhost,ping一下localhost是否能解析。如果不能,需要etc
24、hosts文件里增加相应的项目。三、查看php的fsockopen模块是否启用。方法一:第一步:php.ini文件中查找allow_url_fbpen=On使其瓦为On第二步:php.ini文件中查找extension=php_openssl.dll如果前面有分可,去掉分号第三步:重启Web服务器,叩ache或IIS方法二:1 .viphp.ini找到allow_url_fopen这个参数设置成On,即allow_url_fbpen=On2 .让你的PhP支持OPenSn扩展。默认,是没有OPenSSl扩展的,只能重新编译安装。yuminstallopensslopenssl-develcdu
25、srlocalsrcphp-5.2.14extopensslusrlocalphpbinphpize./configure-with-openssl-with-php-config=usrlocalbinphp-configmake&makeinstall看提示,把编译成的OPenSSLso拷贝到你在php.ini中指定的extension_dir下3 .viphp.ini加入extension=openssl.so4 .重启Webserver四、监控对象占满了trapper进程导致前端与server无法通信“Atleastonetrapperprocessmustberunningtodis
26、playserveravailabilityandviewqueueinthefrontend.,Trapper进程用于接收前端查询server可用性及队列的请求将StartTrappers=20调整到StartTraPPerS=I00,重启zabbix-servero9、Zabbix监控虚拟主机告警LaCkoffreeswapspaceonZabbixserver解决办法Zabbix监控虚拟机的时候有时候会报一下告警St近20个问JS主机问盘问叁发生时间时长信息确认动作ZaMxxserverlackoffreeswapspaceonZattMxserver2018-05-181542:301
27、301713mS112是因为Zabbix监控没有考虑虚拟主机的交换空间情况解决办法修改配置ZABBIX监测中资产记录报表配置管理主机群组模板主机触动作自动发现IT服务模板应用集监控项触发器图形糜合图形5TemplateIPMiIntelSR1530TempiateIPMlIntelSR163O国TemplateJMXGenericTiBm(MateJMXTomCatQTenxMateOSAixem5tftWetM,eOftWebIS测WttaWeWS测Wet添财TemplateAppZabWxAgentTemplateAppZabtxxAflentTemplateAppZabtxxAgentT
28、emplateAppZabtxxAgentTemplateAppZabbaAgentTemplateAppZabtaxAgentTemplateWpZaMXxAgentTemplateAppZabtxxAgentTemplateSnmpGener,TegaeeSInterfaces4购中资产记录83模板所Ea,%v03ieOSL3SfllOffiC4323015BB5B9XBM2WeeSftflHifiK石左悔.N你mpaOSUnwc|可研容你DecoheredotsHptrsOrSLruxsenmtomcatWLaImachinesZaM)C-主机IweIe版主机版动作日动发现r11es施测
29、中资产记录窿表三e三问题:在安装配置好zabbix后无法正常启动,原因是SELINUX设置问题导致启动失败。故障分析:lrootlocalhostzabbix#systemctlstartzabbix-server.serviceJobforzabbix-server.servicefailedbecauseaconfiguredresourcelimitwasexceeded.See,systemctlstatuszabbix-server.serviceandjournalctl-xefordetails.IrOOtoCaIhoStzabbix#journaled-xeDefined-By
30、:systemdSupport:Unitzabbix-server.servicehasbegunstartingup.1月0715:21:17IocalhostJocaldomainsystemdl:PlDfilerunzabbixzabbix-server.pidnotreadable(yet?)afterstart.1月0715:21:17IocalhosLlocaldomainsystemdl:zabbix-server.serviceneverwroteitsPIDfile.Failing.1月0715:21:17IocalhostJocaldomainsystemdl:Failed
31、tostartZabbixServer. Subject:Unitzabbix-server.servicehasfailed Defined-By:systemd Support: Unitzabbix-server.servicehasfailed. Theresultisfailed.1 月0715:21:17IocalhostJocaldomainsystemdl:Unitzabbix-server.serviceenteredfailedstate1 月0715:21:17IocaihostJocaldomainsystemdl:zabbix-server.servicefailed
32、.1月0715:21:17IocalhostJocaIdomainpolkitd804:UnregisteredAuthenticationAgentforunix-process:6787:8831344(systembusname1月0715:21:24IocalhostJocaldomainpolkitd804:RegisteredAuthenticationAgentforunix-process:6797:8832061(systembusname:1月0715:21:27IocalhostJocaldomainsystemdl:zabbix-server.serviceholdof
33、ftimeover,schedulingrestart.1月0715:21:27IocalhostJocaldomainsystemdl:StartingZabbixServer.Subject:Unitzabbix-server.servicehasbegunstart-upDefined-By:systemdSupport:Unitzabbix-server.servicehasbegunstartingup1月0715:21:27IocalhostJocaldomainsystemdl:PIDfilerunzabbixzabbix-server.pidnotreadable(yet?)a
34、fterstart.1月0715:21:27IocalhostJocaldomainsystemd11:zabbix-server.serviceneverwroteitsPlDfile.Failing.1月0715:21:27IocalhostJocaldomainsystemdl:FailedtostartZabbixServer.Subject:Unitzabbix-server.servicehasfailedDefined-By:systemdSupport:Unitzabbix-server.servicehasfailed.Theresultisfailed.1月0715:21:
35、27IocalhostJocaldomainsystemdl:Unitzabbix-server.serviceenteredfailedstate.1月0715:21:27IocalhostJocaldomainsystemd(1:zabbix-server.servicefailed.1月0715:21:27IocalhostJocaldomainpolkitd804:UnregisteredAuthenticationAgentforUniX-PrOCeSS:6797:8832061(systembusnamelines1907-1944/1944(END)1.astlogin:TueJ
36、an723:24:432020from10.100.81.67查看zabbix日志分析:发现日志提示权限问题:5966:20200107:145500.376usingconfigurationfile:etczabbixzabbix-server.conf5966:20200107:145500.376cannotsetresourcelimit:13Permissiondenied5966:20200107:145500.376cannotdisablecoredump,exiting.5976:20200107:145506.314StartingZabbixServer.Zabbix4
37、.4.4(revision3131fdacO4故障处理:优化修改SELINUX=CiisabledIrOOtloCalhoStselinux#viconfigThisfilecontrolsthestateofSELinuxonthesystem.SELINUX=cantakeoneofthesethreevalues:enforcing-SELinuxsecuritypolicyisenforced.permissive-SELinuxprintswarningsinsteadofenforcing.disabled-NoSELinuxpolicyisloaded.SELINUX=disab
38、ledSelinUXTYPE=cantakeOneofthreetwovalues:targeted-Targetedprocessesareprotected,minimum-Modificationoftargetedpolicy.Onlyselected#processesareprotected.mis-MultiLevelSecurityprotection.SELlNUXTYPE=targeted重新启动:IrOOtloCaIhOSt-#systemctlstartzabbix-server.serviceIrOOtloCaIhOSt#systemctlstatuszabbix-server.servicezabbix-server.service-ZabbixServer1.oaded:loaded(usrlibsystemdsystemzabbix-server.service;disabled;vendorpreset:disabled)Active:active(ru