跳到主要内容

lsload

介绍

lsload 是一个用于显示集群节点负载信息的工具,功能与LSF系统下的 lsload 类似。它通过查询FSCHED调度器获取主机资源使用情况,并支持自定义输出格式和过滤条件。


参数说明

可用参数列表

选项功能描述主要差异
-a显示所有主机信息,包括 Dynamic Cluster 虚拟机主机。未支持 Dynamic Cluster 虚拟机主机,仅显示标准 LSF 主机。
-I仅显示指定的负载指标。无差异。
-l长格式显示负载信息,包含 I/O 和外部负载指标的额外字段。it输出为dummy值0,未包含外部负载指标。
-w宽格式显示负载信息,字段不截断。it输出为0
-N显示标准化的 CPU 运行队列长度负载指标。计算时cpu_factor设为dummy值2.5
-E显示有效的 CPU 运行队列长度负载指标。无差异。
-n仅显示请求数量的主机的负载信息。无差异。
-R仅显示满足资源需求的主机的负载信息。支持通过selectr15s,r1m,r15m,ut,pg,io,ls,it,tmp,swp,status中的任一条件过滤,不支持逻辑运算符和四则运算符,不支持其它res_req
-V打印版本号。无差异。
-h显示命令用法。实现了更详细的帮助信息。

默认输出项和-l输出项

输出项功能描述主要差异
HOST_NAME标准主机名,通常为具有两个组件的互联网域名。无差异。
status主机的状态,可能包括 ok-okbusylockWlockUunavail实现了 ok,unavail,busy,lockU状态,未实现 -ok,lockW状态。
r15s15 秒指数平均 CPU 运行队列长度。无差异。
r1m1 分钟指数平均 CPU 运行队列长度。无差异。
r15m15 分钟指数平均 CPU 运行队列长度。无差异。
ut过去一分钟的 CPU 利用率指数平均值,范围为 0 - 1。无差异。
pg过去一分钟的内存分页速率指数平均值,单位为页/秒。无差异。
ls当前登录用户数。无差异。
it主机的空闲时间(UNIX 上为键盘未触摸时间,Windows 上为屏幕保护程序激活时间)。输出dummy值0
tmp/tmp 中的可用空间量。无差异。
swp可用交换空间量。无差异。
mem可用内存量。无差异。
io磁盘 I/O 速率指数平均值,默认不显示,-l才输出。无差异。

hostname过滤条件

过滤项功能描述主要差异
默认无显示所有主机信息无差异。
host_name ...显示选择的主机的信息无差异。
cluster_name显示选择的集群的节点的信息。未支持多集群,只显示当前集群的节点信息。

使用示例

示例1:显示所有主机的默认负载信息

lsload

输出字段说明:包括主机名、状态(ok/busy/unavail/lockU)、CPU负载指标(r15s/r1m等)、内存使用情况等。


示例2:限制显示前3台主机

lsload -n 3

仅输出负载最高的前3台主机信息。


示例3:过滤满足资源条件的主机

# 显示内存>10000MB的主机
lsload -R "select[mem>10000]"

示例4:使用宽格式输出

lsload -w

调整字段排列方式以适应更宽的显示布局。


注意事项

兼容性差异(LSF vs FSCHED)

  • 不支持的功能-o 参数无法自定义输出格式,使用会报错。

参数冲突

  • CPU运行队列参数互斥-N-E 不能同时指定。
  • 格式选项行为:若同时使用 -l-w,最后一个设置的参数决定最终输出格式。

支持的 -R 参数语法

-R 的值为LSF风格的资源字符串,格式例如:

"select[mem>10000]"