跳到主要内容
版本:FCP 24.05

设置飞书告警

飞书告警机器人的配置

添加飞书机器人

按照下面文档,在发送告警通知的飞书中增加机器人

添加飞书机器人

配置消息模板

按照下面的文档配置消息模板

配置消息模板

  1. 选择 webhook,json 填写见附录

img.png

参数

{
"status": "firing",
"alerts": [
{
"status": "firing",
"labels": {
"strategyName": "111111"
},
"annotations": {
"level": "通知",
"resourceType":"FILE_SYSTEM",
"monitorMetricStr":"服务组件等于异常","resourceName": "filesystem-1",
"resourceNode": "head-1",
"mgmtNode":null,
"monitorType": "SERVICE",
"curValue":"0.000",
"svcName":"slurmdbd"
}
}
]
}
  1. 定制机器人消息

img_1.png

通知内容中设置告警级别颜色

img_3.png

img_2.png

  1. 查看测试消息

img_2.png

img_4.png

附录

消息中的 json 填写,见下面的解释

  • 告警 json
{
"status": "firing",
"alerts": [
{
"status": "firing",
"labels": {
"strategyName": "111111"
},
"annotations": {
"level": "通知",
"resourceType": "FILE_SYSTEM",
"monitorMetricStr": "服务组件等于异常",
"resourceName": "filesystem-1",
"resourceNode": "head-1",
"mgmtNode": null,
"monitorType": "SERVICE",
"curValue": "0.000",
"svcName": "slurmdbd"
}
}
]
}
  • 恢复 json
{
"status": "resolved",
"alerts": [
{
"status": "resolved",
"labels": {
"strategyName": "111111"
},
"annotations": {
"level": "紧急",
"resourceType": "CLUSTER",
"monitorMetricStr": "CPU 使用率大于 100%",
"resourceName": "clusterAAA",
"resourceNode": "head-1",
"mgmtNode": "Fastone-Core",
"monitorType": "HOST",
"curValue": "1.0",
"svcName": null
}
}
]
}

格式说明: 数组表示告警的指标,如果数组中有一个状态为 firing,那么最外层的状态为 firing

字段说明:

  • status:resolved,和 firing,对应告警和恢复
  • level:对应平台页面中的级别,取值为通知,紧急等
  • resourceType:监控的资源类型,CLUSTER 或者 FILE_SYSTEM
  • monitorMetricStr: 监控的指标
  • resourceName: 监控的资源名称,集群名称或者文件系统名称
  • resourceNode: 触发告警的节点,一般为某个集群下的某个节点
  • mgmtNode: 平台节点,为 Fastone-Core,Fastone-Common,Fastone-Monitor
  • monitorType: 监控指标分类,为 HOST 或者 SERVICE
  • curValue: 监控指标当前值
  • svcName: 当监控指标属于 SERVICE 时,对应的触发告警的服务名称,比如 slurmdbd,node-exporter 等
  • strategyName: 策略名称 具体可参照平台页面的告警记录

示例

在飞书6.11.16版本增加告警通知到群消息,其他版本如果存在差异,可以参考官方文档

  • 在飞书中找到飞书捷径

img_3.png

  • 新建机器人应用

img_4.png

img_5.png

  • 创建流程

img_6.png

  • 创建触发器

img_7.png

  • 选择webhook触发

img_8.png

  • 输入参数(示例见上)

img_9.png

  • 选择操作

img_10.png

  • 设置消息内容

img_11.png

消息内容可依据告警策略类型进行修改

img_12.png

  • 启用

img_13.png

  • 发布

img_14.png

最后由 sun liqian2024年3月6日 更新

上一页解锁admin用户下一页集群最小化安全组列表