监控服务
- 为了保证响应速度,在监控图表中展示折线图数据时,只显示排名前30的节点。
- 仅FCP-Suite或FCP-SE开启混合云后,支持文件系统和基础节点监控。
监控服务中的图表的图表可以随意拖动、放大缩小,方便您更加方便查看图表信息,刷新界面图表会返回至原始状态。
集群监控
集群监控分为多个维度,包括集群监控、计算分区监控、节点列表监控、节点监控、GPU 监控、服务状态监控和调度器监控。
集群监控
实时监控数据: 集群维度的计算节点数量、计算分区数量、计算节点CPU核心数、计算节点CPU使用率、等待中作业平均等待时长。
图表:可根据右上角调整时间,查看所需时间的监控数据
- 计算节点CPU使用百分比折现图
- 集群作业状态数量饼图:Fsched调度器内存中统计到的等待中、运行中、已完成的作业数量
- 运行中的CPU数折线图
- 等待中的CPU数量折线图
- 等待中作业平均等待时长折线图
- 集群作业状态数量堆叠图:Fsched调度器内存中统计到的等待中、运行中、已完成的作业数量
- 计算节点数折线图
计算分区监控
实时监控数据:分区维度的等待中作业平均等待时长、节点数、CPU核心数、调度器CPU总数、空闲的CPU、运行中的CPU数、等待中的CPU数、CPU使用率、内存使用率。
图表:可根据右上角调整时间,查看所需时间的监控数据
- 分区CPU使用率折线图
- 分区运行中的CPU百分比折线图
- 分区内存使用率折线图折线图
- 分区运行中的CPU数量折线图
- 分区CPU核心数折线图
- 分区等待中作业平均等待时长折线图
- 分区总内存及已分配的内存折线图
- 分区已分配内存百分比折线图
- 分区等待中的作业数量折线图
- 分区运行中的作业数量折线图
- 分区计算节点数折线图
节点列表
实时监控数据:节点维度的所属分区、 开机时间、CPU数量、内存总量、根分区、CPU使用率、内存使用率、根分区使用率、交换空间利用率。
节点监控
实时数据:节点维度的运行时间、CPU数、CPU iowait、总内存、总文件描述符、总CPU使用率、内存使用率、交换空间使用率
图表:可根据右上角调整时间,查看所需时间的监控数据
- CPU使用率折线图
- Swap信息折线图
- 内存信息折线图
- 每5分钟流量堆叠图
- 系统平均负载折线图
- 每秒磁盘读写容量折线图
- 每秒网络带宽使用折线图
- 磁盘读写速率(IOPS)折线图
- 打开的文件描述符(左)/每秒上下文切换次数(右)折线图和点阵图
- 磁盘使用率折线图
- 网络Socket连接信息折线图
- 每1秒内I/O操作耗时占比折线图
- 每次IO读写的耗时(参考:小于100ms)(beta)折线图
GPU监控
实时数据:节点维度的GPU数量、警告、GPU使用率、显存使用率
图表:可根据右上角调整时间,查看所需时间的监控数据
- GPU使用率(详情)折线图
- 显存利用率(详情)折线图
- GPU频率折线图折线图
- 功率折线图
- 显存频率折线图
- GPU温度折线图
- 显存温度折线图
- 显存使用量(帧缓存)折线图
- 显存空闲量(帧缓存)折线图
注意:CentOS 6.x 不支持GPU监控。
服务监控
集群内每台节点的服务状态监控
调度器监控
展示Fsched集群中节点在调度器层面的状态
节点状态
- 完全分配:
- 部分分配:
- 空闲:
- 不可用:
- 故障:
桌面监控
节点监控
根据选择的桌面和节点,显示主机硬件资源的信息,包含CPU、内存、存储等多个方面。
GPU监控
当节点存在GPU设备时,展示GPU资源相关信息。
注意:CentOS 6.x 不支持GPU监控。
服务监控
根据选择的桌面和节点,展示桌面相关服务运行状态。
文件系统监控
节点监控
显示文件系统硬件资源监控信息,包含CPU、内存、存储等多个方面。
服务监控
展示文件系统相关服务运行状态。
性能监控
显示文件系统关于性能相关的监控,展示IOPS、吞吐量、延迟,以及可用容量、总容量的信息。
管理节点监控
节点监控
显示系统平台各主机硬件资源的信息,包含CPU、内存、存储等多个方面。
服务监控
展示根据选择的节点,展示系统平台系统服务运行状态。
基础节点监控
节点监控
显示平台中各基础节点硬件资源的信息,包含CPU、内存、存储等多个方面。