跳到主要内容
版本:FCP 24.11

监控服务

提示
  1. 为了保证响应速度,在监控图表中展示折线图数据时,只显示排名前30的节点。
  2. 仅FCP-Suite或FCP-SE开启混合云后,支持文件系统和基础节点监控。

监控服务中的图表的图表可以随意拖动、放大缩小,方便您更加方便查看图表信息,刷新界面图表会返回至原始状态。

集群监控

集群监控分为多个维度,包括集群监控、计算分区监控、节点列表监控、节点监控、GPU 监控、服务状态监控和调度器监控。

集群监控

实时监控数据:集群维度的计算节点数量、计算分区数量、计算节点CPU核心数、计算节点CPU使用率、等待中作业平均等待时长。

图表:可根据右上角调整时间,查看所需时间的监控数据

  • 计算节点CPU使用百分比折现图
  • 集群作业状态数量饼图:Fsched调度器内存中统计到的等待中、运行中、已完成的作业数量
  • 运行中的CPU数折线图
  • 等待中的CPU数量折线图
  • 等待中作业平均等待时长折线图
  • 集群作业状态数量堆叠图:Fsched调度器内存中统计到的等待中、运行中、已完成的作业数量
  • 计算节点数折线图

计算分区监控

实时监控数据:分区维度的等待中作业平均等待时长、节点数、CPU核心数、调度器CPU总数、空闲的CPU、运行中的CPU数、等待中的CPU数、CPU使用率、内存使用率。

图表:可根据右上角调整时间,查看所需时间的监控数据

  • 分区CPU使用率折线图
  • 分区运行中的CPU百分比折线图
  • 分区内存使用率折线图折线图
  • 分区运行中的CPU数量折线图
  • 分区CPU核心数折线图
  • 分区等待中作业平均等待时长折线图
  • 分区总内存及已分配的内存折线图
  • 分区已分配内存百分比折线图
  • 分区等待中的作业数量折线图
  • 分区运行中的作业数量折线图
  • 分区计算节点数折线图

节点列表

实时监控数据:节点维度的所属分区、开机时间、CPU数量、内存总量、根分区、CPU使用率、内存使用率、根分区使用率、交换空间利用率。

节点监控

实时数据:节点维度的运行时间、CPU数、CPU iowait、总内存、总文件描述符、总CPU使用率、内存使用率、交换空间使用率

图表:可根据右上角调整时间,查看所需时间的监控数据

  • CPU使用率折线图
  • Swap信息折线图
  • 内存信息折线图
  • 每5分钟流量堆叠图
  • 系统平均负载折线图
  • 每秒磁盘读写容量折线图
  • 每秒网络带宽使用折线图
  • 磁盘读写速率(IOPS)折线图
  • 打开的文件描述符(左)/每秒上下文切换次数(右)折线图和点阵图
  • 磁盘使用率折线图
  • 网络Socket连接信息折线图
  • 每1秒内I/O操作耗时占比折线图
  • 每次IO读写的耗时(参考:小于100ms)(beta)折线图

GPU监控

实时数据:节点维度的GPU数量、警告、GPU使用率、显存使用率

图表:可根据右上角调整时间,查看所需时间的监控数据

  • GPU使用率(详情)折线图
  • 显存利用率(详情)折线图
  • GPU频率折线图折线图
  • 功率折线图
  • 显存频率折线图
  • GPU温度折线图
  • 显存温度折线图
  • 显存使用量(帧缓存)折线图
  • 显存空闲量(帧缓存)折线图

注意:CentOS 6.x 不支持GPU监控。

服务监控

集群内每台节点的服务状态监控

调度器监控

展示Fsched集群中节点在调度器层面的状态

节点状态

  • 完全分配:
  • 部分分配:
  • 空闲:
  • 不可用:
  • 故障:

桌面监控

节点监控

根据选择的桌面和节点,显示主机硬件资源的信息,包含CPU、内存、存储等多个方面。

GPU监控

当节点存在GPU设备时,展示GPU资源相关信息。

注意:CentOS 6.x 不支持GPU监控。

服务监控

根据选择的桌面和节点,展示桌面相关服务运行状态。

文件系统监控

节点监控

显示文件系统硬件资源监控信息,包含CPU、内存、存储等多个方面。

服务监控

展示文件系统相关服务运行状态。

性能监控

显示文件系统关于性能相关的监控,展示IOPS、吞吐量、延迟,以及可用容量、总容量的信息。

管理节点监控

节点监控

显示系统平台各主机硬件资源的信息,包含CPU、内存、存储等多个方面。

服务监控

展示根据选择的节点,展示系统平台系统服务运行状态。

基础节点监控

节点监控

显示平台中各基础节点硬件资源的信息,包含CPU、内存、存储等多个方面。