服务器备份原理,服务器冗余链路备份的实现原理与过程

许多企业都搭建了各种信息平台,服务器作为信息平台的硬件载体,其稳定性日趋重要。其中,网络链路又是尤为重要的一环,显然,如何保障服务器网络链路的持续稳定工作已成为摆在网络管理员、系统管理员面前的重要问题了。

增加热备份冗余链路成为保障服务器链路通畅常用的方法之一,此方式可以强化系统网络链路,减少故障率。

这里提到的冗余备份方式可以应用于企业的重要业务访问,实施后,相应业务在多种冗余技术的支持下,将会更加稳固。

本文将以单机和集群两种环境来解说相关冗余备份的实现原理与过程。

单机环境

下图为服务器双网卡接入的基本拓扑图,为保证网络设备热备份,核心设备、服务器接入设备都使用了双机,配置802.1q Trunk模式互联,属同一VTP Domain,并都启用了STP(Spanning Tree Protocol,生成树协议),利用STP实现网络设备、网络链路的切换,将一台Cisco3550设置为STP根(root)交换机。图1中标block的端口即STP协商后屏蔽的端口,以避免环路,无数据流量可视为中断。另外将Cisco2950交换机的终端接入端口设置为PortFast,以加快交换机端口启用时间。

《服务器备份原理,服务器冗余链路备份的实现原理与过程》

单机环境下的网络拓扑

1. 软件使用原则

服务器接入可以通过使用网卡捆绑软件实现热备冗余,对于服务器双网卡捆绑软件的选择可遵循以下几点原则: 兼容性好,能在不同品牌网卡上使用; 中断恢复快; 能检测深层中断,即能检测到非直连设备的中断。

2. 推荐软件

NIC Express 4.0是一款兼容性较好的捆绑软件,它能兼容Broadcom、D-Link等常见网卡,但在Intel网卡上安装会造成大量丢包。

Inter Proset是针对Intel网卡的专用网卡捆绑软件,但Inter Proset只能在Intel网卡上使用,且不支持深层中断的检测。

3. 软件设置

NIC Express 4.0

使用NIC Express的ELB模式,将网络检测这一关键参数设置为Status Packet,而不能使用Auto,因为设置为Auto只能检测到直连部分的中断情况,而设置为Status Packet可以通过发状态包,检测到网络中的非直连部分的中断,响应时间更快。其余可使用默认设置。

Inter Proset

使用默认设置即可,另外需要注意: 使用Inter Proset的网卡有隐含的主备关系,即只有主用工作,主用网卡中断后隐含的主备关系交换,再接回后主备关系不变化。本文所有测试时,都使用2号网卡为主用的情况。

4. 三种测试方式

中断服务器网线测试

测试方式: 中断服务器所连网线,再接回,看有无中断。

测试结论: 使用网卡捆绑软件后,中断任意一条网线或接回均不会造成数据传输中断。

中断交换机间网线测试

测试方式: 采用单一中断和组合中断方式测试。

测试结论: 单一或组合中断②号网线,由于交换机重新协商STP,会中断50秒左右。

单一或组合中断⑦号网线,NIC Express 4.0由于可检测深层中断,所以不会造成中断; 而Inter Proset无法检测到下一级网络中断,中断或接回⑦号网线,都会中断45秒左右。

交换机断电测试

测试方式:分别关闭两台核心Cisco3550、两台服务器接入Cisco2950,再开机,测试中断情况。

测试结论: 关闭或打开根交换机(核心主用Cisco3550)电源,由于根漂移,STP重新协商,需中断45秒左右。另外3台交换机关开机均不会造成数据传输中断。

集群环境

各交换机间的连接同前,服务器则使用两台双网卡服务器和一台EMC磁盘阵列建立集群。比较之前的连接情况,这种设置集合了STP网络、双网卡捆绑、集群这三种冗余措施,给服务器带来最强有力的不中断保障。

由于中断交换机间网线和交换机掉电结果同前,故在此不再赘述。只测试中断服务器连接的网线测试。

《服务器备份原理,服务器冗余链路备份的实现原理与过程》

分别中断群集主备机所连交换机的网线,再接回,测试业务中断情况。结果是不会造成数据传输中断,对业务无任何影响。

集群环境下需要特别注意的是:

当集群主机两条线路同时中断时,将发生集群主备机切换。

较多的集群组会导致群集主备切换时间的增加。集群故障检测的时间与虚拟服务器的数量成正比,断定一个虚拟服务器故障需时约30秒,并且这个过程是串行而非并行的。

集群的应用与网卡设置无关,集群主备机使用单块物理网卡和使用双物理网卡捆绑出虚拟网卡所得出的结论相同,无论单双网卡均可实现服务器群集功能。

对服务器双网卡捆绑出的虚拟网卡进行调整前应该先退出集群(停止节点集群服务→退出节点)。

由于多重冗余多重保护,并非所有故障都会导致业务中断,系统能正常运行并不代表系统中没有故障,需要加强检查监控予以防范。

    原文作者:韭菜实验室
    原文地址: https://blog.csdn.net/weixin_33700405/article/details/119293993
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞