BlueKing / DevOps / 系统运维

蓝鲸增强套餐-监控日志平台部署

浅时光博客 · 9月6日 · 2021年 · 52838次已读

一、蓝鲸介绍

蓝鲸是腾讯游戏运营部自主研发的一套具有多项探索式创新的,为业务量身打造的,定制化的一站式运维体系。功能完善,体验佳;但是安装部署繁琐,中间踩坑比较多,目前最新的稳定版本为6.0.4;从v6版本正式发布之后,监控日志已经独立出来,不再属于基础套餐里的了,所以新版中安装监控日志平台原文链接:https://www.dqzboy.com跟之前部署有很大的差别。

二、适用场景

  1. 适用场景监控告警,日志采集以及故障自愈场景。
  2. 不同业务场景下的监控配置、告警通知、报表视图展示、分析定位及自定义的采集上报等。
  3. 日志采集&检索查询、关键字的日志监控、日志提取等日志服务。
  4. 故障自动处理,包括实时发现告警、预诊断分析、自动恢复故障。

三、安装部署

提示:

(1)部署增强套餐之前,必须先初始化业务拓扑

(2)部署之前,监控日志平台服务器与中控机同属于同一个业务下,比如我这里都属于蓝鲸业务下。

cd /data/install
./bkcli initdata topo

1、下载解压安装包

#注意在中控机上进行操作
[root@blueking01 ~]# cd /data
[root@blueking01 data]# tar xf bkce_co_package-6.0.4.tgz

  • 开始部署前,请确保新增主机跟中控机已实现免密
  • 注意:这里的IP是监控日志平台所要部署的服务器IP地址
[root@blueking01 ~]# ssh-copy-id root@<IP>

2、新增主机Agent安装

  • 前往节点管理,对新增主机进行 agent 安装

3、导入标准运维模板

  • 标准运维流程模版下载
  • 详细步骤:打开标准运维 -> 项目流程 -> 文章来源(Source):浅时光博客导入 -> 点击上传 -> 创建新流程
  • 假设需要部署的监控日志套餐包已放置中控机的/data目录 ,对应套餐包的标准运维流程模版已导入至标准运维。导入可参考如下:

4、检查 install.config

  • 检查 install.config 文件是否已经包含增强套餐的相关模块分布,如果有请先移除相关模块。如无输出则可继续往下操作。
#以下命令在中控机上执行

value_modules=(es7 monitorv3\(influxdb-proxy\) monitorv3\(monitor\) monitorv3\(grafana\) influxdb\(bkmonitorv3\) monitorv3\(transfer\) fta beanstalk log\(grafana\) log\(api\) kafka\(config\))

for module in ${value_modules[@]}; do if grep ${module} /data/install/install.config >/dev/null; then echo -e "The \e[1;31m ${module} \e[0m module exists in install.config, please remove it before deploying."; fi; done
  • 检查新增机器的主机名是否与基础环境机器的主机名是否有冲突。如有冲突,请先进行修改,如无请忽略

5、开始部署相关服务

(1)监控平台

选择 [ce][deploy][bkmonitorv3] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。

填写信息包括:
  • ctrl_ip:基础环境的中控机 IP
  • whole_pkg_path:部署监控平台安装包的绝对路径
  • deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)

提示:执行过程中的详细日志可以在作业平台执行历史中看到

访问监控平台

注意:如果报错ip校验失败,请通过下面方式检查

  1. 中控机是否在蓝鲸业务下
  2. 中控机和监控的机器是否在同一业务下
  3. 中控机和部署监控的机器是否已安装好agent
  4. 是否在蓝鲸业务下导入的流程

(2)日志平台

选择 [ce][deploy][bklog] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。

填写信息包括:
  • ctrl_ip:基础环境的中控机 IP
  • whole_pkg_path:部署日志平台安装包的绝对路径
  • deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)

访问日志平台

(3)自愈平台

选择 [ce][deploy][fta] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。

填写信息包括:
  • ctrl_ip:基础环境的中控机 IP
  • whole_pkg_path:部署故障自愈安装包的绝对路径
  • deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)

访文章来源(Source):https://www.dqzboy.com问故障自愈平台


本文作者:浅时光博客
原文链接:https://www.dqzboy.com/8748.html
版权声明:知识共享署名-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)协议进行许可,转载时请以>超链接形式标明文章原始出处和作者信息
免责声明:本站提供的内容仅限于个人学习和研究使用;禁止将内容用于商业或非法用途。下载后请在24小时内彻底删除,否则后果由用户承担。访问和下载本站内容即表示您已同意上述条款 。

0 条回应

必须 注册 为本站用户, 登录 后才可以发表评论!