跳到主要内容

lsload

介绍

lsload 是一个用于显示集群节点负载信息的工具,功能与LSF系统下的 bjobs 类似。它通过查询FSCHED调度器获取主机资源使用情况,并支持自定义输出格式和过滤条件。


参数说明

可用参数列表

参数是否需要值用途描述注意事项
-l显示不截断的扩展负载信息,包含I/O和外部负载指标。输出字段可能与默认格式不同。
-w使用宽格式显示负载信息(调整字段排列方式)。输出布局与默认格式有差异。
-N显示标准化的CPU运行队列长度指标。必须单独使用,不可与 -E 同时指定。
-E显示有效的CPU运行队列长度指标。必须单独使用,不可与 -N 同时指定。
-n <num>仅显示指定数量的主机负载信息(按负载排序)。<num>必须为正整数。
-R "..."根据资源需求过滤符合条件的主机。需要符合LSF资源语法,支持 rusage[mem,tmp]span[hosts,ptile,block] 等字段。
-o <fmt>不支持自定义输出格式(尝试使用会报错)。该选项目前未实现,如需使用请联系客户支持。

使用示例

示例1:显示所有主机的默认负载信息

lsload

输出字段说明:包括主机名、状态(ok/busy/unavail/lockU)、CPU负载指标(r15s/r1m等)、内存使用情况等。


示例2:限制显示前3台主机

lsload -n 3

仅输出负载最高的前3台主机信息。


示例3:过滤满足资源条件的主机

# 显示内存>4096MB且临时磁盘<512MB的主机
lsload -R 'rusage[mem>4096,tmp<512]:span[hosts=2]'

示例4:使用宽格式输出

lsload -w

调整字段排列方式以适应更宽的显示布局。


注意事项

兼容性差异(LSF vs FSCHED)

  • 不支持的功能-o 参数无法自定义输出格式,使用会报错。
  • 资源语法限制:在 -R 中仅部分LSF资源条件被实现:
    • 支持 rusage[mem,tmp](内存和临时磁盘)
    • 支持 span[hosts,ptile,block](主机块、每节点任务数、分组数量)

参数冲突

  • CPU运行队列参数互斥-N-E 不能同时指定。
  • 格式选项行为:若同时使用 -l-w,最后一个设置的参数决定最终输出格式。

支持的 -R 参数语法

-R 的值为LSF风格的资源字符串,格式例如:

"rusage[mem>4096,tmp<512]:span[hosts=2,ptile=3]"

有效字段说明

字段类型支持参数
rusagemem, tmp(内存/临时磁盘)
spanhosts, ptile, block

注意: 其他LSF资源语法如 select[], cu[], 或 affinity[] 目前未实现,使用可能失败。