跳到主要内容
版本:FCP 24.08

默认的告警策略

功能说明

全局默认的告警策略,该默认策略无需客户自己创建,简化客户维护平台的复杂度

权限说明

  • 仅admin用户可以查看、修改、停用默认的告警策略
  • 默认的告警策略生效于平台中所有的桌面和集群,即平台中任一桌面或集群达到监控项的触发条件,均发出告警通知

默认策略

当环境部署/升级成功后,平台默认生成一条告警策略,默认的告警策略不能删除,可以修改或停用

默认规则如下:

①参数设置

策略名称=defaultPolicy、对象=平台、类型=平台、级别=通知、监测周期=2分钟、持续周期=10次、沉默周期=24小时

②告警规则

默认即有以下告警规则,编辑时可以删除监控项,但至少需要保留一个

持续时间=监测周期持续周期,根据用户的设置自动计算得出

监控项条件阈值单位tips
平台CPU增加>1000
平台CPU减少>1000
节点状态=未知-
节点状态=错误-
节点状态=缺失-
节点状态=瞬态-节点瞬态包含:更新中、创建中、启动中、关机中、移除中/释放中、排队中
桌面/集群状态=瞬态-集群/桌面瞬态包含:更新中、创建中、启动中、关机中、释放中、排队中

③告警行为

发送通知,开启

邮箱:admin的邮箱(如果admin邮箱无法发送,则不发送邮箱通知,仅在告警记录中生成一条告警记录)

默认告警策略支持的操作

  • 编辑:支持编辑级别、监测周期、持续周期、沉默周期、告警规则、告警通知方式;不支持编辑策略名称、对象、类型
  • 停用:默认的告警策略支持停用,停用之后不会再发送告警通知

举例说明

告警记录参考如下

告警时间状态级别对象节点类型策略名称监控项当前值告警规则告警行为
2分钟前告警通知cluster1login1平台defaultpolicy-xxxx节点状态持续20分钟=未知,当前值为未知节点状态=未知发送通知
2分钟前告警通知desktop1desktop1平台defaultpolicy-xxxx节点状态持续20分钟=瞬态,当前值为更新中节点状态=瞬态发送通知
2分钟前告警通知desktop1-平台defaultpolicy-xxxx节点状态持续20分钟=瞬态,当前值为更新中集群/桌面状态=瞬态发送通知
2分钟前告警通知desktop1-平台defaultpolicy-xxxxodin任务状态持续20分钟=卡死,当前值为卡死odin任务状态=卡死发送通知