标准Fsched为了防止节点资源碎片化,会在节点释放资源时,延迟新任务的调度。直到该节点上的待释放任务全部完成。这个状态叫做“Completing”。在Completing状态下的节点,不会接受新的任务调度。但是这个行为会导致EDA一类,只需要一个CPU/slot的任务,调度效率降低。为了解决这个问题,我们提供了跳过节点Completing的功能。
支持版本
10.69 及以上
使用说明
- 配置
SlurmctldParameters
增加fsched_no_node_completing
参数。