bqueues
介绍
bqueues
是用于查询 FSCHED 集群中队列信息的命令,替代 LSF 的 bqueues
功能。它提供多种格式和过滤选项,帮助用户快速了解队列状态、资源分配及调度策略。
参数说明
可用参数列表
参数 | 是否需要值 | 值类型/范围 | 用途 |
---|---|---|---|
-w | 否 | N/A | 显示宽格式队列信息,适合横向扩展显示。 |
-l | 否 | N/A | 使用长多行格式详细展示每个队列的信息(如调度参数、资源限制和关联主机列表)。 |
-m <value> | 是 | 主机名/集群名称/"all" | 过滤显示在指定主机或集群可运行作业的队列。若为“all”,则仅显示覆盖所有节点的队列。 |
-u <value> | 是 | 用户名/"all" | 显示允许指定用户提交作业的队列。若值为“all”,筛选出对任何用户开放的队列。 |
--noheader | 否 | N/A | 移除输出中的表头行,仅显示数据内容。 |
-alloc | 否 | N/A | 显示运行(RUN)和系统挂起(SSUSP)槽位的计数器统计。 |
使用示例
1. 基本队列列表
bqueues
默认以简短格式显示所有队列的基本信息,包括名称、优先级、状态及任务计数。
2. 宽格式显示
bqueues -w
扩展输出宽度,适合横向展示更多字段(如资源限制和负载阈值)。
3. 过滤特定主机上的队列
bqueues -m compute-cluster01
仅显示可在名为 compute-cluster01
的集群上运行作业的队列。
4. 查看允许用户提交的队列
bqueues -u developer_team
列出允许用户 developer_team
提交作业的所有队列。若指定 -u all
,则显示对所有用户开放的队列。
5. 长格式详细信息
bqueues -l
以长格式输出每个队列的详细参数(如调度策略、负载阈值、关联主机列表等)。
6. 组合选项使用
bqueues -m all -l --noheader
筛选所有节点可用的队列,并以无表头的长格式显示其详细信息。
注意事项
-
与 LSF 的兼容性差异:
- 原 LSF 中的
-o
参数(自定义输出格式)暂未被支持,如有需要请联系客户支持。
- 原 LSF 中的
-
参数值有效性检查:
- 输入无效主机名、集群名称或用户名时,命令会提示具体错误信息。例如:
Bad host name
或User cannot use the queue
。 - 参数值区分大小写,请确保与集群配置一致。
- 输入无效主机名、集群名称或用户名时,命令会提示具体错误信息。例如:
-
特殊条件处理:
- 使用
-m all
时,仅显示节点数目等于整个集群总节点数的队 列。 - 若未指定具体队列名称且过滤条件不匹配(如主机不存在),命令返回错误码
255
并提示原因。
- 使用