lsload
介绍
lsload 是一个用于显示集群节点负载信息的工具,功能与LSF系统下的 lsload 类似。它通过查询FSCHED调度器获取主机资源使用情况,并支持自定义输出格式和过滤条件。
参数说明
可用参数列表
| 选项 | 功能描述 | 主要差异 |
|---|---|---|
-a | 显示所有主机信息,包括 Dynamic Cluster 虚拟机主机。 | 未支持 Dynamic Cluster 虚拟机主机,仅显示标准 LSF 主机。 |
-I | 仅显示指定的负载指标。 | 无差异。 |
-l | 长格式显示负载信息,包含 I/O 和外部负载指标的额外字段。 | it输出为dummy值0,未包含外部负载指标。 |
-w | 宽格式显示负载信息,字段不截断。 | it输出为0。 |
-N | 显示标准化的 CPU 运行队列长度负载指标。 | 计算时cpu_factor设为dummy值2.5 |
-E | 显示有效的 CPU 运行队列长度负载指标。 | 无差异。 |
-n | 仅显示请求数量的主机的负载信息。 | 无差异。 |
-R | 仅显示满足资源需求的主机的负载信息。 | 支持通过select用r15s,r1m,r15m,ut,pg,io,ls,it,tmp,swp,status中的任一条件过滤,不支持逻辑运算符和四则运算符,不支持其它res_req。 |
-V | 打印版本号。 | 无差异。 |
-h | 显示命令用法。 | 实现了更详细的帮助信息。 |
默认输出项和-l输出项
| 输出项 | 功能描述 | 主要差异 |
|---|---|---|
HOST_NAME | 标准主机名,通常为具有两个组件的互联网域名。 | 无差异。 |
status | 主机的状态,可能包括 ok、-ok、busy、lockW、lockU、unavail。 | 实现了 ok,unavail,busy,lockU状态,未实现 -ok,lockW状态。 |
r15s | 15 秒指数平均 CPU 运行队列长度。 | 无差异。 |
r1m | 1 分钟指数平均 CPU 运行队列长度。 | 无差异。 |
r15m | 15 分钟指数平均 CPU 运行队列长度。 | 无差异。 |
ut | 过去一分钟的 CPU 利用率指数平均值,范围为 0 - 1。 | 无差异。 |
pg | 过去一分钟的内存分页速率指数平均值,单位为页/秒。 | 无差异。 |
ls | 当前登录用户数。 | 无差异。 |
it | 主机的空闲时间(UNIX 上为键盘未触摸时间,Windows 上为屏幕保护程序激活时间)。 | 输出dummy值0 |
tmp | /tmp 中的可用空间量。 | 无差异。 |
swp | 可用交换空间量。 | 无差异。 |
mem | 可用内存量。 | 无差异。 |
io | 磁盘 I/O 速率指数平均值,默认不显示,-l才输出。 | 无差异。 |
hostname过滤条件
| 过滤项 | 功能描述 | 主要差异 |
|---|---|---|
| 默认无 | 显示所有主机信息 | 无差异。 |
| host_name ... | 显示选择的主机的信息 | 无差异。 |
| cluster_name | 显示选择的集群的节点的信息。 | 未支持多集群,只显示当前集群的节点信息。 |
使用示例
示例1:显示所有主机的默认负载信息
lsload
输出字段说明:包括主机名、状态(ok/busy/unavail/lockU)、CPU负载指标(r15s/r1m等)、内存使用情况等。
示例2:限制显示前3台主机
lsload -n 3
仅输出负载最高的前3台主机信息。
示例3:过滤满足资源条件的主机
# 显示内存>10000MB的主机
lsload -R "select[mem>10000]"
示例4:使用宽格式输出
lsload -w
调整字段排列方式以适应更宽的显示布局。
注意事项
兼容性差异(LSF vs FSCHED)
- 不支持的功能:
-o参数无法自定义输出格式,使用会报错。
参数冲突
- CPU运行队列参数互斥:
-N和-E不能同时指定。 - 格式选项行为:若同时使用
-l或-w,最后一个设置的参数决定最终输出格式。
支持的 -R 参数语法
-R 的值为LSF风格的资源字符串,格式例如:
"select[mem>10000]"