新建集群
提示
- 在创建集群时,单个集群中允许的节点总数上限为 200 个。
- 仅在FCP-Suite开启混合云功能后可以创建按量和包年包月节点。
- 仅在FCP-Suite开启混合云功能后可以使用费用预估功能。
"新建集群"功能允许您在平台中快速构建一个高性能计算环境。通过模板化引导与可视化配置,您可以将复杂的硬件、软件与调度策略封装为可一键部署的集群,极大地简化了HPC环境的初始化工作。
集群类型
平台支持创建以下几种类型的集群,以满足不同的业务和技术需求:
-
Fsched集群
- 这是最常用的集群类型,使用 Fsched 作为核心作业调度器。
- 适用于需要复杂作业调度、队列管理、资源配额控制、优先级调度等高级功能的通用高性能计算(HPC)场景。
- 用户通过调度器命令(如
srun,sbatch)提交和管理作业。
-
None-Linux集群
- 指运行 Linux 操作系统,但 无内置作业调度器(如Fsched) 的集群。
- 适用于无需复杂作业调度、用户直接通过SSH登录节点运行任务,或使用第三方集群管理工具(如Kubernetes, Slurm等)的场景。
- 提供基础的节点管理、网络和存储集成能力。
-
None-Windows集群
- 指运行 Windows 操作系统,且 无内置作业调度器 的集群。
- 适用于完全依赖Windows生态的特定应用(如某些商业EDA软件、Windows版科学计算软件),且习惯通过远程桌面或特定管理工具进行任务分发的场景。
费用预估
在配置集群时,系统会根据您当前的选择,提供以 31天(约一个月) 为周期的费用预估,帮助您规划预算。
- 估算对象:
- 动态节点:您在配置中设置的"手动节点数量"。
- 自动伸缩节点:根据您设置的"伸缩最大数量"和预计负载模型进行的估算。
- 估算周期与模式:
- 费用预估基于 按量计费(后付费) 模式计 算。
- 默认按所选节点规格 24小时不间断运行31天 进行估算,得出一个参考上限。
- 对于自动伸缩节点,系统会根据您设置的伸缩最小值和伸缩最大值,分别计算其在该区间内按24小时不间断运行31天所产生的费用范围,为您提供一个浮动的估算区间。
- 包年包月优惠提示:
- 若您的计算负载长期稳定,采用包年包月(预付费) 模式通常能大幅节省成本。
- 系统会在费用预估区域显示与按量计费的对比,直观展示选择包年包月模式可能节省的费用百分比。
- 建议:对于需要连续运行超过1个月的生产环境核心节点,优先考虑包年包月计费方式。
注意:费用预估仅为参考,实际费用以最终账单为准。自动伸缩节点的实际费用取决于作业负载和闲置释放策略。
前提条件
开始创建集群前,请确保您已具备相应权限:
- 拥有创建集群的系统权限。
- 如需使用特定集群模板,需拥有该模板的使用权限。
- 如需关联特定静态节点或网络资源,需拥有对应资源的访问权限。
- 创建集群过程中涉及的部分专业术语,可提前阅读名词解释以帮助理解。
相关权限的详细说明,请查看权限说明文档。
新建集群流程
1. 选择集群模板
创建集群的第一步是选择合适的模板作为基础。
- 界面说明:进入"新建集群"后,系统会展示所有您拥有权限的集群模板列表,包括模板名称、描述和集群类型。
- 模板状态:
- 可用模板:点击即可进入详细配置界面。
- 不可用模板:若模板因缺少必要参数而不可用,将显示"该模板缺少参数,请联系管理员重新编辑模板"的提示,且无法被选中。
- 无模板提示:若您未被授权使用任何模板,界面将提示"暂无可使用的集群模板,请联系管理员授权"。
2. 配置集群
选择模板后,进入集群核心配置页面。此处的配置将作为整个集群的默认设置。
字段说明
- 集群名称:系统自动生成一个名称。您可将其修改为3~62个字符,以字母开头,仅包含字母、数字和"-"的名称。
- 用户资源限制:开启后, 默认所有用户无法向该集群提交作业。需后续通过"集群配额"功能为用户显式分配资源后才可使用。(仅Fsched集群有效)
- SSH登录限制:开启后,可阻止用户绕过调度器直接通过SSH登录计算节点,确保所有计算任务都经过统一调度和管理。(仅Fsched集群有效)
- 告警服务:开启后,集群创建时将自动创建默认告警策略。具体说明请参阅下文告警服务详细说明。
- 释放保护:开启后,任何用户(包括管理员)都无法释放此集群,防止误操作。
- 配置挂载:为整个集群设置共享存储挂载点。具体说明请参阅下文配置挂载详细说明。
- 自定义设置:集群级别用于配置Fsched调度器的高级参数。请在明确参数含义和影响后进行设置,具体说明请参阅下文自定义设置详细说明。(仅Fsched集群有效)
3. 配置计算分区
分区是集群资源管理和调度的核心单元,用于满足不同场景的业务需求。(注意:None-Linux与None-Windows集群的分区概念主要用于资源分组,不具备Fsched的调度策略功能且只能创建1个分区)