作业监控
本手册将详细介绍如何使用 FCP 用户门户的作业列表功能,查看用户通过调度器提交的作业信息,包括作业状态、提交时间、运行时间、资源使用情况等。
前提条件
- 已拥有 FCP 用户门户账号并完成登录。
- 已通过调度器提交作业。
访问作业列表
- 登录 FCP 用户门户。
- 在云工作台页面,点击“作业列表”按钮。
作业列表信息
作业列表页面将显示以下信息:
- 作业 ID: 作业的唯一标识符。
- 作业名称: 作业的名称。
- 用户:提交作业的用户名。
- 状态: 作业的当前状态,例如“等待中”、“运行中”、“已完成”、“失败”等。
- 执行主机:作业实际运行的物理主机或节点名称。
- 分区:作业运行的计算分区或队列名称。
- 节点申请:作业申请的计算节点数量。
- 内存申请:作业申请的内存资源大小。
- CPU 申请:作业申请的 CPU 核心数量。
- 项目:作业所属的项目名称或编号。
- CPU 占用时间:作业实际使用的 CPU 时间。
- 执行时间:作业从开始运行到结束运行的总时长。
- CPU 占用/申请:CPU 占用时间与 CPU 申请时间的比值。
- 等待时间:作业从提交到开始运行之间的等待时间。
- 提交时间: 作业的提交时间。
- 开始时间: 作业的开始运行时间。
- 结束时间: 作业的结束运行时间。
- 退出码:作业运行完成的退出码。
- 退出信号:作业运行的退出信号。
作业筛选和排序
- 快捷筛选标签
- 等待中&运行中作业:筛选处于排队状态和正在执行的作业。
- 已完成作业:筛选已经完成的作业(包括成功和失败)。
- 全部作业:展示所有状态的作业汇总,是默认视图。
- 筛选: 可以根据作业状态、提交时间、作业名称、用户、队列、项目、执行主机等条件筛选作业。
- 排序: 可以点击表头,根据作业 ID、提交时间、开始时间、结束时间、运行时间、CPU 占用时间、执行时间、等待时间等字段对作业进行排序。
常见问题
- 无法查看作业列表:
- 请确认您已通过调度器提交作业。
- 请检查网络连接是否正常。
- 作业状态异常:
- 请查看作业日志,排查错误原因。
- 请联系管理员检查调度器配置和运行状态。
- 作业状态长时间处于“等待中”:
- 请检查队列资源是否充足。
- 请联系管理员调整作业优先级或资源分配策略。