前言:
现时同学们对“jsontrigger”大体比较看重,小伙伴们都想要学习一些“jsontrigger”的相关文章。那么小编也在网摘上汇集了一些有关“jsontrigger””的相关文章,希望我们能喜欢,姐妹们一起来学习一下吧!作者:唐辉
1.文档编写目的
Fayson在这里先介绍下CM中的trigger,也就是触发器。触发器是当一个或多个特定条件得到满足的服务、角色、角色组、或主机将采取指定动作的声明。条件为tsquery语句,要采取的操作是将服务,角色,角色配置组或主机的运行状况更改为Concerning 状态(黄色告警)或Bad状态(红色告警),用于我们更直观掌握到个人所关心集群状况。关于tsquery在《0597-5.16.1-如何在CM界面自定义图表》文章中有简单介绍
测试环境:
1.RedHat7.2
2.CDH6.2.0
2.创建触发器
创建触发器常用的有几种方式,一种是在数图表(大多数图表,主页展示的图表没有该功能)的下拉菜单中单击“ 创建触发器 ”,针对某中图表创建触发器,另一种是在某个服务或者主机、角色>状态 页面然后单击“运行状况测试”右边 “ 创建触发器”按钮,另外一种是直接在配置文件中配置。值的注意的是:创建触发器时要根据触发器的属性从相应的位置创建触发器,如主机相关、服务相关、角色相关的触发器,否则可能出现在预览中显示正常,但是CM界面不触发的情况,在下文中Fayson会举例说明
2.1.示例1:在HDFS容量图表中自定义使用容量触发器。
在CM界面>图表中选中HDFS容量图表 >点设置 选择创建触发器
打开后默认界面如下:
可以看到默认有3个值的查看,鼠标放到生成的图表上可以看到分别是配置的HDFS容量、使用的HDFS容量和使用的非HDFS容量。可以看到图中使用的HDFS容量为35.2G,在下面我们将配置使用的HDFS容量超过10G时就在CM界面进行红色告警。
红色字体部分为修改部分,添加触发器名字为dfs_capacity_used测试
IF (select dfs_capacity, dfs_capacity_used, dfs_capacity_used_non_hdfs where entityName=$SERVICENAME AND last(dfs_capacity_used) > 10GiB ) DO health:bad
然后填充到表达式中进行预览如下:
为保证有效,改成100GiB显示未触发
编辑成功后在下面点击保存触发器
然后返回CM主页查看,可以看到HDFS上有一个告警
点这个告警查看,就是我们刚刚编辑的告警,可以在操作中对触发器再次编辑、禁用、抑制、或者删除
2.2.示例2:DataNode 打开文件数超过阈值告警触发器
选择HDFS 然后点击创建触发器,如下图所示
IF ((SELECT fd_open WHERE roleType=DataNode AND last(fd_open) > 300) OR (SELECT fd_open WHERE roleType=NameNode AND last(fd_open) > 300)) DO health:bad
然后保存查看
CM界面显示告警
2.3.示例3:主机CPU使用率超过阈值告警触发器
点集群任意主机>主机名>状态 点击创建触发器
注:创建触发器时要根据触发器的属性从相应的位置创建触发器,比如上述两个例子都是HDFS的触发器,都从HDFS服务中创建触发器,而下面是有关主机的属性,所以从主机中创建,否则会出现在预览中显示触发器正常,但是在集群状态中查看与设置的不相符的情况
单个主机的CPU使用率监控:
IF (select cpu_percent where entityName=$HOSTID and min(cpu_percent) > 8) DO health:bad
或者通过编辑器模式添加
添加成功后CM界面出现如下告警
群集所有主机CPU使用率超过阈值触发器:
IF (SELECT cpu_percent_across_hosts WHERE entityName = "1" AND category = CLUSTER AND last(cpu_percent_across_hosts ) >3) DO health:concerning
配置后发现所有的主机都变成了存在隐患的状态
随便选择其中一个主机查看,就可以发现我们刚才设置的触发器已经生效
除上述的配置外,我们当然也可以通过如下配置和删除触发器在服务中> 配置 > 选中高级>搜索 service trigger,在触发器中生成的配置已Json 文件的格式存储在配置中
3.总结
通过创建触发器,可以更直观的在CM界面查看所关注的内容告警信息,提高对集群和服务的状态管控
参考:
标签: #jsontrigger