📄️ 为Fsched集群开启负载阈值功能减少节点OOM通过对Fsched设置负载阈值,可以实现当计算节点的可用内存/CPU使用率超过设置的阈值时,自动关闭计算节点(sinfo将显示该节点状态为drain),阻止新作业分配到计算节点上,有效降低系统OOM和宕机的风险。
📄️ 为Fsched集群开启负载阈值功能减少节点OOM通过对Fsched设置负载阈值,可以实现当计算节点的可用内存/CPU使用率超过设置的阈值时,自动关闭计算节点(sinfo将显示该节点状态为drain),阻止新作业分配到计算节点上,有效降低系统OOM和宕机的风险。