跳到主要内容

bqueues

介绍

bqueues 是用于查询 FSCHED 集群中队列信息的命令,替代 LSF 的 bqueues 功能。它提供多种格式和过滤选项,帮助用户快速了解队列状态、资源分配及调度策略。


参数说明

可用参数列表

选项功能描述主要差异
-alloc显示作业slot的统计信息,独占作业和非独占作业显示的 slot 数不同。无差异。
-h打印命令用法并退出。实现了更详细的帮助信息。
-l以长格式显示队列信息,包括队列描述、特性、调度参数等。细节在后面章节列出。
-m显示指定主机、主机组、集群或所有主机的队列信息。未支持主机组的显示。
-noheader移除输出中的列标题。无差异。
-u显示指定用户、用户组或所有用户的队列信息。未支持用户组的显示。
-V打印 LSF 版本信息并退出。无差异。
-w以宽格式显示队列信息,字段不截断。未实现RSV输出,未实现所有状态(如 Inact_WinInact_Adm 等)。

默认的输出项

输出项功能描述主要差异
QUEUE_NAME队列的名称。无差异。
PRIO队列的优先级,数值越大优先级越高。无差异。
STATUS队列的状态,包括 OpenClosedActiveInactive无差异。
MAX队列可用的最大job slot数,- 表示无限制。无差异。
JL/U每个用户可以在队列中使用的最大job slot数,- 表示无限制。无差异。
JL/P每个处理器可以从队列中处理的最大job slot数,- 表示无限制。未实现per processor的最大job slot数的配置和显示
JL/H每个主机可以从队列中分配的最大job slot数,- 表示无限制。无差异。
NJOBS队列中所有作业的总slot数,包括待处理、运行中和暂停的作业。无差异。
PEND队列中所有待处理作业的任务总数。无差异。
RUN队列中所有运行中作业的任务总数。无差异。
SUSP队列中所有暂停作业的任务总数。无差异。

-l选项的输出项

输出项功能描述主要差异
Description队列的典型用途描述。描述只包含队列名称,没有其它描述信息。
Default queue indication默认队列标识。无差别。
PARAMETERS/STATISTICS队列的nice值、状态、最大任务数、用户任务限制等信息。未实现NICE值,Inact_WinInact_AdmSTATUS, JL/P, SSUSP, RSV
Schedule delay for a new job新作业提交后的调度延迟时间。输出固定为 0 秒,未实现NEW_JOB_SCHED_DELAY参数配置。
Interval for a host to accept two jobs主机接受两个作业的间隔时间。输出固定为 0 秒,未实现JOB_ACCEPT_INTERVAL参数配置。
SCHEDULING PARAMETERS调度参数,包括 r15sr1mr15mutmem 等负载指标。实现了r15s,r1m,r15m,ut,mem,未实现pg,io,ls,it,tmp,swp
SCHEDULING POLICIES调度策略,如 FAIRSHARE输出固定为 FAIRSHARE,未实现调度策略的配置。
USER_SHARES用户资源份额分配。输出固定为 [default, 1],未实现用户fairshare的配置。
USERS允许使用队列的用户列表。无差别。
HOSTS队列可以调度作业的主机列表。无差别。

使用示例

1. 基本队列列表

bqueues

默认以简短格式显示所有队列的基本信息,包括名称、优先级、状态及任务计数。

2. 宽格式显示

bqueues -w

扩展输出宽度,适合横向展示更多字段(如资源限制和负载阈值)。

3. 过滤特定主机上的队列

bqueues -m compute-cluster01

仅显示可在名为 compute-cluster01 的集群上运行作业的队列。

4. 查看允许用户提交的队列

bqueues -u developer_team

列出允许用户 developer_team 提交作业的所有队列。若指定 -u all,则显示对所有用户开放的队列。

5. 长格式详细信息

bqueues -l

以长格式输出每个队列的详细参数(如调度策略、负载阈值、关联主机列表等)。

6. 组合选项使用

bqueues -m all -l --noheader

筛选所有节点可用的队列,并以无表头的长格式显示其详细信息。


注意事项

  1. 与 LSF 的兼容性差异

    • 原 LSF 中的 -o 参数(自定义输出格式)暂未被支持,如有需要请联系客户支持。
  2. 参数值有效性检查

    • 输入无效主机名、集群名称或用户名时,命令会提示具体错误信息。例如:Bad host nameUser cannot use the queue
    • 参数值区分大小写,请确保与集群配置一致。
  3. 特殊条件处理

    • 使用 -m all 时,仅显示节点数目等于整个集群总节点数的队列。
    • 若未指定具体队列名称且过滤条件不匹配(如主机不存在),命令返回错误码 255 并提示原因。