FCP-Suite升级为Core-HA架构
仅FCP-Suite产品版本支持。
导读
在实际的FCP-Suite场景中,一些较大的客户,拥有较大规模的集群,这些较大规模的集群依赖FCP-Suite进行调度,来完成客户的HPC任务。
FCP-Suite所有的核心服务均依赖于core节点,很可惜的是,我们很难保障一台机器永远不会出现故障,为了应对可能出现故障,FCP-Suite在24.11版本提供了Core-HA的能力,当主core节点宕机时,从core节点能够顶替主core节点,继续提供集群调度的服务。
什么是Core-HA?
在FCP-Suite架构下,我们有一个core节点和monitor节点,monitor节点主要职责是监控,而core节点则承载了集群管理、任务调度等主要功能,所谓Core-HA,就是core节点将以一主一备的方式实现集群管理、任务调度等主要功能的高可用,当主core节点宕机,备用的core节点可以立即接管工作。
注意:在FCP-Suite架构下,因为common服务也在core节点上,所以Core-HA本质上也包含了Common-HA,但是不包含Monitor-HA。
前置条件
为了保障Core-HA能够按照预期工作,客户至少需要提供3个节点,以确保当主节点宕机时,能够自动failover到从节点,保障stack继续工作。
- 一个已经安装了FCP-Suite的core节点和monitor节点
- 该core节点将为作为Core-HA的
主core节点 - 该monitor节点,除了承担监控职责以外,还会担任
witness的角色,用于仲裁主从切换。
- 该core节点将为作为Core-HA的
- 一个与当前core节点规格相同的
从core节点 - 一个VIP(可选),VIP可以在必要的时候,切换所指向的真实的
主core节点IP或者从core节点IP。注意,使用VIP有一些必要条件:- VIP是私有网络中的IP,在网络内必须唯一,且不能与网络内的其他IP地址冲突。
- VIP必须在网络内是可路由的,即必须能够在不同的物理主机或虚拟机之间传递,能够通过网络设备(如路由器、交换机)正常路由和通信。
- 大多数情况下,VIP 和Core节点的物理服务器或虚拟机需要位于同一个子网中,以确保 ARP 广播可以在局域网内传播。
- 如果要跨子网使用VIP,即VIP和Core节点的物理服务器或虚拟机不在同一子网内,请正确配置好路由,使得VIP在不同子网能够正常传递ARP广播,确保流量可以在不同子网之间传递。
- 一个
外置NTP服务:在Core-HA架构下,为了保证多节点的系统时间一致性,客户必须能够提供一个外置NTP服务,如果客户没有外置NTP服务,可以参考本地搭建ntp服务
准备工作
在正式开始升级Core-HA之前,我们还需要做好如下几个准备:
-
准备
从core节点,节点配置和主core节点保持一致 -
安装
从core节点-
获取fcp的安装包
-
解压到
从core节点上的/opt目录下cd /opt
tar -zxvf fastone-fcp-{VERSION}.tgz -
进入install目录,执行:
cd fastone-{VERSION}/install
sudo ./install-fcp.sh -r core-follower
-
-
准备好
从core节点的LICENSE,这主要是因为,截止至24.11版本,LICENSE依然是强关联本机的机器码。[!NOTE]
注意:
从core节点的LICENSE,需要使用从core节点的机器码生成。