龙空技术网

基于centos7.8玩转蓝鲸6.0社区版(上)

波波说运维 1696

前言:

今天我们对“centospssh”大致比较注意,你们都需要剖析一些“centospssh”的相关知识。那么小编在网上网罗了一些对于“centospssh””的相关知识,希望兄弟们能喜欢,朋友们快快来学习一下吧!

概述

蓝鲸6.0版本比5.1.29版本多了很多功能,所以在前几个星期就一直在等了,后来上了新版本后就拿了3台服务器部署体验下,如果上生产这个版本确实要比5.1.29版本适合很多,新增加的用户、权限方面都是做的很细的,也增加了很多其他的功能,大家有兴趣都可以去体验下。。

下面简单介绍下部署的过程..

一、安装环境准备

1.1 准备机器

操作系统: CentOS 7.8机器配置生产环境:3台服务器,每台6核 32 G,硬盘80G 机器数量:3 台(ip 分别为:xxx.84,xxx.85,xxx.86)选择一台为中控机(xxx.84)进行安装部署操作,使用 root 账号登录。

1.2 获取证书

通过 ifconfig 或者 ip addr 命令分别获取三台机器第一个内网网卡 MAC 地址前往蓝鲸官网证书生成页面(),根据提示在输入框中填入英文分号分隔的三个 MAC 地址,生成并下载证书上传证书包至中控机 /data证书包包名:ssl_certificates.tar.gz

1.3 下载安装包

下载安装包,选择 6.0.0 版本:上传安装包至中控机 /data完整包包名:bkce_src-6.0.0.tgz

1.4 解压相关资源包

1)解压完整包(包含蓝鲸相关产品,如 PaaS、CMDB、JOB 等;蓝鲸依赖的 rpm 包,SaaS 镜像,定制 Python 解释器;部署脚本)

cd /datatar xf bkce_src-6.0.0.tgz

2)解压各个产品软件包

cd /data/src/; for f in *gz;do tar xf $f; done

3)解压证书包

install -d -m 755 /data/src/certtar xf /data/ssl_certificates.tar.gz -C /data/src/cert/chmod 644 /data/src/cert/*

4)拷贝 rpm 包文件夹到/opt/目录

cp -a /data/src/yum /opt

1.5 自定义安装配置

1)生成 install.config

cat << EOF >/data/install/install.configxxx.84 iam,ssm,usermgr,gse,license,redis,consul,es7,monitorv3(influxdb-proxy),monitorv3(monitor),monitorv3(grafana)xx.85 nginx,consul,mongodb,rabbitmq,appo,influxdb(bkmonitorv3),monitorv3(transfer),fta,beanstalkxx.86 paas,cmdb,job,mysql,zk(config),kafka(config),appt,consul,log(api),nodeman(nodeman)EOF

2)对 install.config 中的主机配置中控机 ssh 登录免密。根据提示,依次输入每台机器的 root 密码

bash /data/install/configure_ssh_without_pass

二、开始部署蓝鲸

2.1 初始化操作

1)执行初始化操作

# 快速部署暂不支持自定义安装目录cd /data/install/--7.3需要先装pssh:yum install -y pssh./bk_install common

2)检查相关配置

./health_check/check_bk_controller.sh

2.2 部署 PaaS

nohup ./bk_install paas >> bk_paas.log &

PS:在这里把碰到的一些报错也放一下吧,所以才分了上下两篇,因为报错还有点多..

>>>常见报错1:Error: Package: akonadi-mysql-1.9.2-4.el7.x86_64 (@anaconda)

解决方案:

这个报错是装数据库的时候没先卸载mariadb,这个应该是操作系统(之前一开始用centos7.3)问题导致,但是脚本本身在装数据库的时候没做判断也是有问题啊..

rpm -qa|grep "mariadb"|xargs -i rpm -e --nodeps {}

>>>常见报错2:systemd[1]: bk-license.service failed.

解决方案:

1)查看报错:

journalctl -u bk-license

2)检查权限

可以看到权限有问题,但是在重新授权之后重启还是存在问题

3)检查umask值

在修改umask值后重新跑就可以了,这个问题主要是这台服务器都是直接做了镜像克隆出来的,一开始就已经配置了umask限制导致。

-- 之前都是0077umask 0022

>>>常见报错3:ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (2)

这个报错可就不好解决了...最后还是蓝鲸的人删库才解决的,而且我部署3次,每次都会碰到..

解决:

1)在mysql机器上查看状态

2)检查socket

3)建立软链接

重新安装还是报错

ln -s /var/run/mysql/default.mysql.socket  /var/lib/mysql/mysql.sock

4)检查变量

echo $BK_IAM_MYSQL_USER

5)声明变量

source /data/install/load_env.sh

6)查看报错日志

7)最后发现是login-path配置问题

mysql_config_editor print --all 如果正常是可以发现有多个sql的

解决方式就是重新安装一下mysql,让他重新生成这个文件

>>>常见报错4:virtualenvwrapper问题

这个问题是pip源的问题

解决:

1)配置pip源

在root用户和blueking用户下配置pip源(~/.pip/pip.conf)

[global]index-url =  = pypi.tuna.tsinghua.edu.cn

2)重新安装报错:

3)在paas机器和中控机执行以下命令

最后手动重装解决..

/opt/py27/bin/pip install pip==19.0.1/opt/py27/bin/pip install pbr/opt/py27/bin/pip install --no-deps stevedore/opt/py27/bin/pip install --no-deps virtualenvwrapper

2.3 部署 app_mgr(SaaS 运行环境)

nohup ./bk_install app_mgr >> bk_app.log &

2.4 部署 CMDB(配置平台)

nohup ./bk_install cmdb  >> bk_cmdb.log &

2.5 部署 JOB(作业平台)

nohup ./bk_install job >> bk_job.log &

2.6 部署 bknodeman(节点管理)

部署到这里基本的功能就都有了..

nohup ./bk_install bknodeman >> bk_bknodeman.log &

>>>常见报错1:SyntaxError: invalid syntax

解决方案:

1)在86服务器看进程状态

systemctl status bk-nodeman.service

2)appo机器查看nodeman

supervisorctl -c /data/app/conf/supervisord.conf status all

3)打开/data/install/initdata.sh 搜索下copy file

4)在节点管理器86上进行测试

workon bknodeman-nodemanexport BK_FILE_PATH=/data/bkce/bknodeman/cert/saas_priv.txt runuser -u blueking ./bin/manage.sh copy_file_to_nginx

5)修改为root用户测试

怀疑是权限上问题..

runuser -u root ./bin/manage.sh copy_file_to_nginx

6)继续安装

修改脚本后问题解决..

vim /data/install/initdata.shnohup ./bk_install bknodeman >> bk_bknodeman.log &

>>>常见报错2:用搜狗浏览器打开节点管理白屏

其实用F12看就知道原因了

解决方案:

flat()用来实现数组扁平化,chrome V68正式版报错"flat is not a function"

升级浏览器至最新的V71方法可以正常使用

更正:flat和flatMap方法为ES2019(ES10)方法,目前还未在所有浏览器完全兼容。浏览器具体兼容情况看下图

安装最新版的谷歌后测试:

哦,这里吐槽下,windows服务器如果默认端口不是3389节点管理这是没法装WINDOWS服务器的,得下个版本才解决这个bug..

篇幅有限,上篇就介绍到这了,有兴趣的朋友可以体验一下相关的功能,蓝鲸在很多功能模块方面的设计都是有可学习的地方的。

后面会分享更多devops和DBA方面内容,感兴趣的朋友可以关注下...

标签: #centospssh