跳到主要内容
版本:FCP 25.02

平台和其关联节点重启或关机的影响

FCP平台整体包含三个主要部分

  • 平台管理节点
    • 管理节点
    • 监控节点(可选)
  • 集群节点
    • 头节点
    • 计算节点
    • 登录节点
    • 桌面节点
  • 外部支撑服务节点
    • 认证信息服务(可选)
    • NTP服务
    • 存储服务

当以上节点关机的时候,影响如下表:

节点类型集群内(fsched)任务任务模式集群管理集群监控用户管理数据访问远程访问
管理节点长时间关机会导致任务accouting信息不准确,短时间无影响无法提交任务无法管理集群无法监控集群无法管理用户无法访问数据无法远程访问
监控节点无法监控集群
头节点无法提交新任务,已经运行完成的任务会继续运行,运行完成后资源无法释放任务失败无法管理集群部分监控信息获取不到
计算节点运行于节点上的任务失败运行于节点上的任务失败无法管理集群该节点信息无法获取
登录节点运行于节点上的交互任务失败无法管理集群该节点信息无法获取
桌面节点运行于节点上的任务失败无法管理集群该节点信息无法获取
认证服务长时间(>1分钟)会导致任务无法提交(无法验证提交身份),短时间无影响长时间(>1分钟)会导致任务无法提交(无法验证提交身份不能登录无法管理用户无法验证无法验证
NTP服务长时间失效时间偏移,导致集群节点间验证失效,无法运行任务,短时间无影响长时间失效时间偏移,导致集群节点间验证失效,无法运行任务
存储服务任务执行可能失败,由应用自身特性决定无法提交任务无法管理集群,管理过程会阻塞无法访问如果用户家目录在共享存储上,无法登录