龙空技术网

Linux运维必知的Zabbix故障排错实战

python易学堂 1030

前言:

现在看官们对“zabbix连接数据库报错”可能比较珍视,同学们都想要剖析一些“zabbix连接数据库报错”的相关资讯。那么小编同时在网上搜集了一些对于“zabbix连接数据库报错””的相关文章,希望各位老铁们能喜欢,大家快快来学习一下吧!

从0开始解决线上Zabbix监控平台故障

(1)学习Linux技术,后期从事Linux运维方面的工作,作为运维人员最主要的工作职责之一:保障企业门户网站、业务系统、数据库、服务器高效稳定的运行,一旦有异常或者故障能够第一时间去解决。

(2)作为运维人员是如何第一时间去获取门户网站、业务系统、数据库、服务器等运行状态呢?是通过手工7x24x365去刷新和访问吗?可以通过开源的监控软件平台7x24x365实时自动的去检测其运行的状态。

(3)互联网IT企业中,主流的开源监控软件有哪些种类呢?

MRTG;

Cacti;

Nagios;

Ganglia;

Zabbix;

Prometheus;

(4)通过线上云服务器构建了一套Zabbix监控平台,发现监控平台无法运行了,而且报错信息如图所示:

Zabbix server is running No localhost:10051

#根据上图的提示,表示Zabbix Server的运行状态是:No,没有监听本地localhost主机地址+10051端口,解决方法:

检测一下Zabbix Server服务进程和端口是否存在;

ps -ef|grep zabbix_server

netstat -tnlp|grep -w 10051

通过手工方式启动一下Zabbix server独立服务即可;

/etc/init.d/zabbix_server start

(5)启动Zabbix Server服务时,报错信息二如下所示:

Can't find file /usr/local/sbin/zabbix_server.

Zabbix server NOT started.

#根据如上的错误提示,表示启动Zabbix Server服务时,启动脚本文件会读取Zabbix Server主程序文件:/usr/local/sbin/zabbix_server,该文件提示不能找到,所以Zabbix Server服务不能启动。

解决方法:

检测Zabbix Server主程序文件/usr/local/sbin/zabbix_server是否存在;

if [ -f /usr/local/sbin/zabbix_server ];then echo ok ;fi

ls -l /usr/local/sbin/zabbix_server

可以通过find|locate工具查找zabbix_server主程序文件的路径;

find / -name "zabbix_server"

find / -name "zabbix_server"|grep -vE "init|bak"

ln -s /usr/local/zabbix/sbin/zabbix_server /usr/local/sbin/

find / -name "zabbix_server"|grep -vE "init|bak" -exec ln -s {} /usr/local/sbin/ \;

(6)启动Zabbix Server服务时,报错信息三如下所示:

Zabbix_server [10775]: user zabbix does not exist

Zabbix_server [10775]: cannot run as root!

#根据如上的错误提示,表示启动Zabbix Server服务时,需要使用zabbix用户去启动,而Linux系统没有检测到该用户,该用户是不存在的,不能使用root用户直接启动。

解决方法:

检测一下Linux系统是否存在zabbix用户;

id zabbix

grep -w zabbix /etc/passwd

通过手工useradd命令创建zabbix用户即可;

useradd -s /sbin/nologin zabbix -M

(7)启动Zabbix Server服务时,报错信息四如下所示:

Connection to database 'zabbix' failed: [1045] Access denied for user 'zabbix'@'localhost' (using password: NO)

#根据如上的错误提示,表示启动Zabbix Server服务时,Zabbix Sever服务组件需要连接后端MYSQL数据库服务,要往数据库中持久化存储客户端监控数据,错误提示使用zabbix用户和空密码,通过localhost登陆数据库服务,访问zabbix库被拒绝。

解决方法:

检测一下后端MYSQL数据库是否授权&创建zabbix库;

show databases;

select user,host,password from mysql.user;

检测zabbix server配置文件,数据库连接信息是否填写密码或者密码是否正确;

基于Zabbix监控线上阿里云服务器

(1)根据如上的Zabbix故障排错,Zabbix监控平台可以正常使用了,作为运维人员能够利用Zabbix监控平台去监控哪些数据呢?监控哪些指标呢?能够给企业带来哪些好处呢?

(2)在企业中,可以使用Zabbix来监控四个层面的数据指标,哪四个层面呢?

硬件层面

Zabbix可以监控硬件服务器设备,例如监控硬件设备的CPU温度、硬盘异常情况、风扇转速、电源异常情况、机箱是否被黑客入侵等。

软件层面

Zabbix可以监控软件服务,例如监控Nginx、Tomcat、MQ、ZK、ELK、Redis、MYSQL、LVS、Keepalived等服务的运行状态、PID、端口号,可以监控服务的返回值、状态码等。

系统层面

Zabbix可以监控Windows/Linux操作系统,监控指标:CPU、MEM、DISK、NET、I/O、Open files、Process、User、Port等。

网络层面

Zabbix可以监控网络设备,例如监控交换机、路由器、防火墙设备,监控其出口和入口的带宽,监控设备之间的网络连通性等。

往期文章精选:

官方调研重磅发布,Pandas或将重构?

想学python看这里!送给小白的六个建议

欢迎大家关注我的头条号,私信“python",学习资料包免费分享给需要的朋友,另有python学习交流群,可以交流学习拓展人脉。

标签: #zabbix连接数据库报错