首页  ·  知识 ·  基础设施
企业服务器群网络高可用性设计探讨
网友  收集  数据中心  编辑:德仔   图片来源:网络
服务器群是企业数据中心的主要组成部分,是企业信息系统的中心,承载着企业的关键应用。随着企业信息系统的集中化和虚拟化,作为企业连接
 服务器群是企业数据中心的主要组成部分,是企业信息系统的中心,承载着企业的关键应用。随着企业信息系统的集中化和虚拟化,作为企业连接服务器和企业网络主干的服务器群网络必须具有高性能、可扩展性和高可用性,能满足不断增长的企业服务器群规模和客户访问需求,其中实现服务器群网络的高可用性尤其重要。

1 网络高可用性

    网络的可用性可以从故障率、可恢复性和鲁棒性三方面来衡量:故障率是指在给定的时间里,网络故障和维护事件出现的次数;可恢复性是指网络从故障状态恢复到正常状态的能力;而鲁棒性是指网络检测和处理故障的能力以及在各种故障情况下仍然具有的工作能力。由于网络是业务系统的承载体,网络的高可用性是为了保障业务系统的高可用性。所以在网络发生故障的情况下,如何迅速检测到故障并且让网络尽快恢复传递能力,使得所承载的企业业务系统具有高可用性是网络高可用性设计的首要目标。网络冗余容错技术可以保持网络在故障情况下的工作能力也即实现网络的鲁棒性,是网络高可用性的主要技术。

    具体的来说,可以通过网络设备、网络链路、路径控制信息的冗余容错,使得网络故障发生时,网络可以无缝地切换到冗余设备或链路,从而保持网络的传递能力。其中网络的控制平面要做到平滑的切换,尽可能减少控制信息的丢失;而网络的转发平面要做到快速切换,尽可能减低切换时延,减少包丢失。

2 网络高可用性技术

    冗余容错技术关键是消除单点故障。网络设计要提供全冗余的架构、以应对可能的硬件故障或线路故障,任何一个网络组件发生故障后的恢复应该对上层应用服务和用户体验是没有影响的。实现网络高可用性的冗余容错技术主要有以下几种:网络设备硬件冗余、链路汇聚、2层链路冗余、网关冗余、冗余路由快速收敛以及不问断转发技术。

    2.1网络设备硬件冗余

    主要指单台网络设备上的硬件冗余,一般有控制引擎冗余、背板冗余、板卡热插拔和电源风扇冗余等。控制引擎冗余主要用在控制平面和转发平面分离的架构中。在控制引擎冗余的设备上,配备了两块控制引擎板,一块实际起作用j另一块备用。主板转发平面的各种转发信息会持续备份到备板上,这样备板随时可以替换主板承担起控制任务。网络设备一旦发现主板异常,立即启动主备切换,由备板接管主板的工作。不过,因为备板在主备切换前不参与控制平面的处理,在切换后需要重新和邻居进行会话协商,所以即使保存了完整的转发表项,但只能避免部分流量不中断。

    2.2链路聚合技术

    (Link-aggation)是指将多条物理链路当作一条逻辑链路使用的技术而网络流量由聚合到逻辑链路中的所有物理链路共同转发。IEEE802.3ad标准定义了如何将两个以上的千兆位以太网连接组合起来,为高带宽网络连接实现负载共享、负载平衡,以及提供更好的可伸缩性服务。在链路聚合技术的支持下,网络传输的数据流被动态地分布到加入链路的各个端口,如果链路使用的多个端口中的一个出现故障,网络传输的数据流可以动态地快速转向链路中其他工作正常的端口进行传输。大部分交换机都支持链路聚合技术。

    2.3二层链路冗余

    STP(Spannng,Tree Protcol,生成树协议)是为了避免2层链路环路而提出来的技术,在解决2层环路的同时能提供链路冗余。STP的收敛时间较慢,通常是30s,特殊情况下要到50s。为了提高STP的收敛速度,IEEE提出了RSTP标准(快速STP)。RSTP相对于STP,大大加快了收敛时间,解决了收敛速度较慢的问题,但是没有解决冗余链路利用率低的问题。在STP/RSTP中如果一个端口被阻断,那么该端口的链路事实上是被闲置了。MSTP(多实例STP)解决冗余链路利用率低的问题。

    2.4网关冗余

    网关冗余技术是让多个物理网关虚拟出一个或多个虚拟网关,而网络缺省网关静态配置成这些虚拟网关,虚拟网关的转发任务由选举出来的某个物理网关承担,只要不是所有物理网关同时故障,总能选举出一个物理网关承担虚拟网关的转发任务。网关冗余技术还可实现流量的负载分担。目前的虚拟网关技术有VRRP(虚拟路由器冗余协议)、HSRP(热备份路由器协议)和GLBP(网关负载平衡协议),其中HSRP和GLBP是CISCO的私有技术。HSRP完成和VRRP类似的功能,它们都不具备负载均衡功能。GLBP做了优化,配置同一个虚拟网关地址就可实现负载均衡功能。

    2.5路由冗余

    可以通过冗余路由来提高网络可用性,当其中一条路径发生故障时,流量可以切换到其他冗余路径。冗余路由可以分为两种情况,一种是等价路由,一种是非等价路由。等价路由各条路径在互为备份的同时实现了负载分担。非等价路由情况下,只有最优路径被启用作分组转发,次优路径只有当最优路径失效时才会被启用。基于链路状态的动态路由OSPF(开放式最短路径优先协议)有较快的收敛速度,可以显著提高在网络节点和链路变化情况下的路由选择和路径切换的速度。而Cisco公司的EIGRP(增强型内部网关路由选择协议)既有距离向量路由协议的特点,同时又继承了链路状态路由协议的优点,也有较好的收敛特性。

    2.6 不间断转发技术

    是基于控制引擎冗余的优化技术。由于因为备份控制引擎冗余板在切换后需要重新和邻居进行会话协商,会在网络上引发路由的再次收敛,造成网络的短暂停顿。而CISCO的无停顿转发NFS(Nonstop Forwarding)和状态切换SSO(StatefulSwitchover)可以维护路由器中两个控制引擎之间路由状态信息,使主备引擎可以在不中断网络运行或丢弃包的情况下进行切换。在切换期间,SSO提供零中断2层连接,而NSF转发3层数据包时保证不丢失分组,或丢失量最小。分组连续转发可以重新建立对等关系,而无需在整个网络中再次收敛路由,从而显著提高了网络可用性。
 

3 服务器群网络高可用性设计

    企业服务器群网络其实就是企业数据中心网络乃至企业园区网中一个有着特定需求的模块,服务器群网络的设计也要遵从园区网络设计的原则,要关注高性能和可扩展性、层次化和可管理性、安全和高可用性。园区网的模块化层次设计,是一种被实践证实了的设计方案,方法是采用“接入、汇聚、核心”3层架构。企业服务器群网络的设计也遵循3层架构,分为核心层、汇聚层和接入层。而其中的接入层是指服务器群接入区。通过将网络高可用性技术运用到网络的各个层次的设计,可以构建具有高可用性的企业服务器群网络。

    3.1核心层高可用性设计

    企业服务器群网络核心层是企业数据中心网络乃至企业园区网核心层的扩展,在一些小型网络的扁平化设计中企业服务器群网络核心层甚至汇聚层的交换机本身就是企业园区网骨干的一部分。核心层网络需要能提供高速的数据交换和高可用性同时又要保持简单性,核心层高可用性设计可考虑以下几点:

    首先,选用双核心或多核心来实现设备级的冗余,从单台设备考虑,选用交换性能和可用性极高的高端路由交换设备,支持双控制引擎、电源冗余、风扇冗余等硬件冗余。

    其次,核心层交换机之间的互联可以利用链路聚合技术,将核心交换机之间的端口和链路组合起来,提高核心层互联带宽以及链路端口的可用性。另外,对于核心层交换机之间的互联最好采用冗余的点到点等价多路径3层互联(如采用OSPF的三角形拓扑互联),因为目前采用硬件加速的3层交换速度已不亚于2层交换速度,而且OSPF等路由协议可以在链路或节点故障时能提供比基于2层的设计更快的收敛速度,通过等价多路径设置还提高了带宽利用率。

    3.2汇聚层高可用性设计

    企业服务器群网络汇聚层在服务器群网络中一方面是核心层的网络元素,参与核心层网络路由设计;另一方面它又是联接接入层所有交换机的汇聚点;同时也是网络策略控制的中心。因此汇聚层的高可用性设计也要从这几方面考虑。

    汇聚层一般以3层交换机对的形式来部署,实现设备级的冗余。可以利用链路聚合技术将汇聚层交换机对之间的端口和链路组合起来,实现高可用的高速互联。汇聚层交换机间可以通过2层主干链路连接,也可以使用3层交换启用路由协议。

    从汇聚层到核心层的连接每台汇聚层交换机采用双链路连接到不同的核心层交换机实现上联链路冗余。针对核心层的连接使用3层交换,启用与核心层一致的快速收敛路由协议,并且进行等价多路径设置,实现链路负载均衡和提高路由收敛速度。

    汇聚层是接入层所有交换机的汇聚点,当汇聚层与接入层交换机之间采用2层连接时可以使用VRRP、HSRP或GLBP实现网关的冗余备份和流量的负载分担。发生链路或节点故障时,收敛速度取决于缺省网关冗余与故障切换,通过合理地配置各种协议状态定时器,可以达到亚秒级的收敛速度。

    由于汇聚层网络策略控制的控制中心,需要提供防火墙、内容交换、SSL、入侵检测、网络分析和高速缓存等保护服务器群安全和提高服务器服务效率的网络策略控制服务。这些服务可以采用独立式的各种服务设备,也可以采用集成在汇聚交换机里的防火墙、内容交换、SSL、入侵检测、网络分析和高速缓存等服务模块。无论是独立布署还是集成布署,都要考虑与汇聚层相适应的高可用性设计,采用包括设备硬件冗余、链路冗余甚至路由与网关的冗余等技术。

    3.3接入层高可用性设计

    服务器群网络接入层实现服务器群的接入。服务器接入层不但要高效可靠地上联汇聚层交换机而且要为服务器提供灵活而高可用的接入服务。服务器接入层高可用性设计涉及到接入层和汇聚层的高可用性互联设计和服务器高可用接入设计。

    接入层和汇聚层的互联通过接入层以交换机对为基础采用双链路上联到汇聚层的不同交换机来实现设备和链路的冗余。最好在接入层部署第3层交换机,启用与汇聚层一致的路由协议,在接入层和汇聚层的冗余设备和链路之间形成3层互联。这种路由到边缘的设计可以利用第3层路由支持冗余链路的负载均衡和路由的快速收敛,实现高可用性和高带宽利用率的双重目的。但这种设计往往把VLAN限制在单个或单对接入层交换机上,虽然有效地限制了广播域但不能满足服务器VLAN跨交换机或交换机对的需求,减少了服务器部署的灵活性;另外,有些多网卡跨交换机或交换机对连接的服务器往往要求不同网卡在同一VLAN中。所以,接入层和汇聚层互联的2层设计也是需要的。

    在接入层和汇聚层2层互联设计中可以利用避免2层环路的同时能提供链路冗余的STP协议。启用快速生成树协议RSTP,使得当2层链路发生变化时实现较快的收敛。同时,在汇聚层交换机上启用VRRP、HSRP或GLBP协议实现网关的冗余备份和流量的负载分担。其中GLBP最好用在无环2层链路互联设计上。

    为了提高服务器接入的可用性,每个服务器都应该双连接到两个接入层交换机。这种双穴连接最好连接到不同的接入层交换机,以避免单一故障点。如果一定要接入同一交换机,也要接到不同的交换机不同的板卡上。另外还可以启用链路汇聚技术或跨交换板卡的以太网通道协议实现服务器与交换机之间链路的高可用性和流量负载均衡。

    值得进一步说明的是如果服务器多穴方式接入到同一台接入层交换机,那么接入层交换机就存在单点故障的可能。建议在这种情况下部署带控制引擎冗余的支持NSF/SSO技术的多层交换机作为接入层交换机。如果接入层采用2层接入层设计,则支持SSO的冗余交换控制引擎能够防护引擎的软硬件故障;如果采用3层的接入层设计,则支持NSF/SSO的冗余控制引擎也能防护控制引擎的软硬件故障。NSF/SSO将分组丢失和网络收敛中断限制在1s内,从而大大提高了具有单点故障隐患的接入层交换机的可用性。

4结束语

    综上所述,服务器群网络的高可用性可以通过在服务器群网络分层设计的各个部分利用相应的冗余容错技术来实现。当然,上述讨论偏重于网络可用性技术的原理和应用,没有涉及到成本费用的考量。如果考虑到投资费用因素,可以对部分重要的服务器所在的网络采用全冗余的设计。而其它服务器还是用单链路、单交换机的接入方式,同时按多用一备方式准备若干备用交换机和备用连接线,一旦交换机或链路发生故障,就可以立即将备用设备替换上去,在最短时间内恢复网络的正常。

本文作者:网友 来源:网络收集
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的