跳到主要内容
版本:FCP 24.08

监控服务

主机监控、调度器监控中的图表可以随意拖动、放大缩小,方便您更加方便查看图表信息,刷新界面图表会返回至原始状态

提示

为了保证响应速度,在监控图表中展示折线图数据时,只显示排名前30的节点

集群监控

分为集群概览概览、CPU监控、GPU监控、服务监控和调度器监控

集群概览

  • 展示集群内计算节点数量,分区数量,CPU总核心数及CPU的使用率
  • 展示集群等待中和运行中的JOB数量
  • 展示集群内分区列表,统计每个分区物理资源和调度器资源及其使用情况

CPU监控

根据选择的集群、分区和节点,显示主机硬件资源的信息,包含CPU、内存、存储等多个方面。

GPU监控

当节点存在GPU设备时,展示GPU资源相关信息

注意:CentOS 6.x 不支持GPU监控

服务监控

根据选择的集群、分区和节点,显示主机服务状态

调度器监控

本页面可显示集群任务队列的情况,包括节点健康状态、子任务状态、作业详情等信息。

Fsched集群支持节点、资源状态监控

节点状态说明

  • 可用=alloc+mix+idle+completing
  • 不可用(节点被管理员标记为不可用)=drain+resv+maint
  • 宕机=down+fail+error

资源状态说明

  • 完全分配=alloc
  • 部分分配=mix
  • 空闲=idle
  • 不可用=drain+resv+maint+down+fail+error+completing

注意:状态对应调度器层面的节点状态

桌面监控

分为主机监控和服务监控

主机监控:根据选择的桌面和节点,显示主机硬件资源的信息,包含CPU、内存、存储等多个方面。

服务监控:根据选择的桌面和节点,展示桌面相关服务运行状态。

管理节点建龙

主机监控

显示系统平台各主机硬件资源的信息,包含CPU、内存、存储等多个方面。

主机监控支持汇总视图

服务监控

展示根据选择的节点,展示系统平台系统服务运行状态

基础节点监控

主机监控

显示平台中各基础节点硬件资源的信息,包含CPU、内存、存储等多个方面。

文件系统监控

分为主机监控、服务监控和性能监控。

主机监控:显示文件系统硬件资源监控信息,包含CPU、内存、存储等多个方面。

服务监控:展示文件系统相关服务运行状态。

性能监控:显示文件系统关于性能相关的监控,展示IOPS、吞吐量、延迟,以及可用容量、总容量的信息。