lsload
介绍
lsload
是一个用于显示集群节点负载信息的工具,功能与LSF系统下的 bjobs
类似。它通过查询FSCHED调度器获取主机资源使用情况,并支持自定义输出格式和过滤条件。
参数说明
可用参数列表
参数 | 是否需要值 | 用途描述 | 注意事项 |
---|---|---|---|
-l | 否 | 显示不截断的扩展负载信息,包含I/O和外部负载指标。 | 输出字段可能与默认格式不同。 |
-w | 否 | 使用宽格式显示负载信息(调整字段排列方式)。 | 输出布局与默认格式有差异。 |
-N | 否 | 显示标准化的CPU运行队列长度指标。 | 必须单独使用,不可与 -E 同时指定。 |
-E | 否 | 显示有效的CPU运行队列长度指标。 | 必须单独使用,不可与 -N 同时指定。 |
-n <num> | 是 | 仅显示指定数量的主机负载信息(按负载排序)。 | <num> 必须为正整数。 |
-R "..." | 是 | 根据资源需求过滤符合条件的主机。 | 需要符合LSF资源语法,支持 rusage[mem,tmp] 和 span[hosts,ptile,block] 等字段。 |
-o <fmt> | 是 | 不支持自定义输出格式(尝试使用会报错)。 | 该选项目前未实现,如需使用请联系客户支持。 |
使用示例
示例1:显示所有主机的默认负载信息
lsload
输出字段说明:包括主机名、状态(ok/busy/unavail/lockU
)、CPU负载指标(r15s/r1m等)、内存使用情况等。
示例2:限制显示前3台主机
lsload -n 3
仅输出负载最高的前3台主机信息。
示例3:过滤满足资源条件的 主机
# 显示内存>4096MB且临时磁盘<512MB的主机
lsload -R 'rusage[mem>4096,tmp<512]:span[hosts=2]'
示例4:使用宽格式输出
lsload -w
调整字段排列方式以适应更宽的显示布局。
注意事项
兼容性差异(LSF vs FSCHED)
- 不支持的功能:
-o
参数无法自定义输出格式,使用会报错。 - 资源语法限制:在
-R
中仅部分LSF资源条件被实现:- 支持
rusage[mem,tmp]
(内存和临时磁盘) - 支持
span[hosts,ptile,block]
(主机块、每节点任务数、分组数量)
- 支持
参数冲突
- CPU运行队列参数互斥:
-N
和-E
不能同时指定。 - 格式选项行为:若同时使用
-l
或-w
,最后一个设置的参数决定最终输出格式。
支持的 -R
参数语法
-R
的值为LSF风格的资源字符串,格式例如:
"rusage[mem>4096,tmp<512]:span[hosts=2,ptile=3]"
有效字段说明:
字段类型 | 支持参数 |
---|---|
rusage | mem , tmp (内存/临时磁盘) |
span | hosts , ptile , block |