监控服务
主机监控、调度器监控中的图表可以随意拖动、放大缩小,方便您更加方便查看图表信息,刷新界面图表会返回至原始状态
提示
为了保证响应速度,在监控图表中展示折线图数据时,只显示排名前30的节点
集群监控
分为集群概览概览、CPU监控、GPU监控、服务监控和调度器监控
集群概览
- 展示集群内计算节点数量,分区数量,CPU总核心数及CPU的使用率
- 展示集群等待中和运行中的JOB数量
- 展示集群内分区列表,统计每个分区物理资源和调度器资源及其使用情况
CPU监控
根据选择的集群、分区和节点,显示主机硬件资源的信息,包含CPU、内存、存储等多个方面。
GPU监控
当节点存在GPU设备时,展示GPU资源相关信息
注 意:CentOS 6.x 不支持GPU监控
服务监控
根据选择的集群、分区和节点,显示主机服务状态
调度器监控
本页面可显示集群任务队列的情况,包括节点健康状态、子任务状态、作业详情等信息。
Fsched集群支持节点、资源状态监控
节点状态说明
- 可用=alloc+mix+idle+completing
- 不可用(节点被管理员标记为不可用)=drain+resv+maint
- 宕机=down+fail+error
资源状态说明
- 完全分配=alloc
- 部分分配=mix
- 空闲=idle
- 不可用=drain+resv+maint+down+fail+error+completing
注意:状态对应调度器层面的节点状态
桌面监控
分为主机监控和服务监控
主机监控:根据选择的桌面和节点,显示主机硬件资源的信息,包含CPU、内存、存储等多个方面。
服务监控:根据选择的桌面和节点,展示桌面相关服务运行状态。