来源(久久网络-网络学堂)

From: http://www.99net.net/study/know/1113124051.htm

网络系统中的新技术

--------------------------------------------------------------------------------
2003-11-13 12:40:51

自修复技术

计算机网络技术是当前发展速度最快、生命力最强、对人类社会影响最大、新技术新工艺涌现最多和最猛烈的前沿技术,以至于人们对它的依赖程度越来越深,包括企业、政府、学校、科研等越来越离不开网络、越来越受到网络的直接或间接制约,从而又反过来迫使人们对计算机网络系统的可靠性、可用性和整体性能的要求和期望越来越高。

众所周知,作为计算机网络系统的核心设备,服务器功能越来越强大,服务器在计算机网络中的地位也日益重要。而服务器至网络的连接性能同样不可忽视,它与服务器的可靠性和整个网络的可靠性同等重要。在实际应用中,无论是网线断了、集线器或交换机端口坏了、还是网卡坏了或各接口接触不良等现象都会造成网络通信连接的中断。或者在网络系统中,服务器、路由器、交换机、集线器以及各种冗余部件等出现各类大小故障时,都将危及网络系统的稳定和可靠运行,这一点人们是有切肤之痛的。毫不夸张地说,网络运行的机制有待完善、网络运行的管理庇点百出、网络运行的维护还不存章理。因此,为了保证网络系统的正常运行,现代网络系统从硬件和软件两方面正在运用多种高新技术,在此,我们将谈谈这几种新技术。本期先探讨自修复技术。

当用户不能正常使用系统而被迫关机时,所造成的损失对于企业来讲,可能是相当大的。然而在实际应用中,不管人们采用了多么先进的防患措施和安全技术来提高系统的可靠性和可用性,这种非正常关机事件总是无法避免的。面对这种关机现象所带来的巨大损失,随着网络安全技术的发展,无可奈何的人们只得把希望寄托在不停机服务器上。采用自修复技术的自修复服务器就是一种无需人工干预、监视和修理的永远不会关机的服务器系统。

所谓自修复服务器是指它能够预测问题、并能根据问题采取纠错处理和优化系统性能的具有智能化管理功能的服务器。它具有如下基本特征,一是问题预测,即可预测一个事件发生过程中所需要的三种不同行为:监视、检测和分析。监视负责观察一个服务器系统的各个部件的性能是否与期望相符。检测就是当某个事件发生时,系统能够及时发现。分析则是根据事件发生的频率和严重性,来判断是否即将发生错误,然后向系统管理员报警;二是纠错处理,一旦预测到错误事件并报警,系统就要采取合适的纠错处理,以防止关机事件的发生。在有些情况下,系统还能够重新动态分配资源,避开问题的出现区域,从而彻底防止关机事件。而在另一些情况下,系统管理员会接到系统提供的如建议增加磁盘容量或替换发生潜在故障的驱动器和部件等处理建议。三是性能优化,采用软硬件配置,通过平衡各个部件之间的负载以及系统的自我调整,从而提高服务器系统的性能。

自修复服务器目前还处于发展阶段,现在向服务器系统中加入自修复功能还是一个动态积累的过程,随着越来越多的自修复功能的实现,服务器系统将最终实现完全的自修复系统的高可靠性目标。自修复技术是高可用性环境中一个非常重要的特点,适合于许多重要的商业应用。

随着依靠服务器系统的企业数量的增加,其中不仅包括企业内部的使用,还包括对外商业需要的使用。服务器能够连续运转变得比以往更加重要。用户可以在任何地方、任何时间在线访问企业服务器。当然,自修复系统还有待于建立统一的工业标准,使之能在CPU通信的设备管理中提供一个通用的框架,为I/O管理和IA-64位处理器结构等几个正在发展中的新技术创造条件。自修复服务器的发展过程是一个动态发展过程,工作原理要求系统具有向事件预测、纠错处理和性能优化中不断添加新的运行方案和作业能力的完善机制,使之最终达到具有全面的自修复性能。

负载均衡

负载均衡是提高系统性能的一种前沿技术,也是一种广泛应用于服务器群集系统中的新技术。一台IA服务器的处理能力是每秒几万个,无法在一秒钟内处理几十万甚至上百万个请求。但若能将10台这样的服务器组成一个系统,并有办法将所有请求平均分配到所有的服务器,那么这个系统就会拥有每秒处理几十万到几百万个请求的能力。这就是负载均衡的基本思想。目前市场上有多种负载均衡产品,由于其应用的主要技术不同,所反映的特点和性能也就有所不同,根据这些区别,我们可以将它们分为轮询DNS、硬件解决方案、协商式处理和流量分发等负载均衡系统。下面我们就来介绍这些基本系统。

轮询DNS:轮询DNS方案可以说是技术上最简单、应用上方便、结构上最直观的一种负载均衡方案。其基本原理是,在DNS服务器中设定对同一个Internet主机名的多个IP地址的映射,在DNS收到查询主机名的请求时,系统就会循环地将所有对应的IP地址逐个返回。这样,就能够将不同的客户端连接定位到不同的IP主机上,也就能够实现比较简单的负载均衡功能。但这种方案有两个致命的缺点,一是只能实现对基于Internet主机名请求的负载均衡,而不是IP地址,如果是直接基于IP地址的请求则系统无能为力。二是在群集内有节点发生故障的情况下,DNS服务器仍会将这个节点的IP地址返回给查询方,也就仍会不断地有客户请求试图与已出故障的节点建立连接。在这种情况下,即使手工修改DNS服务器的对应设置,将故障节点的IP地址删除,但由于Internet上所有的DNS服务器都有缓存机制,所以仍会有成千上万的客户连接不到群集,除非等到所有DNS缓存都超时为止。

硬件解决方案:该方案主要是指制造商直接制造出带有NAT(网络地址转换)功能的高档路由器或交换机来实现系统负载均衡功能。所谓NAT,就是实现多个私有IP地址对单个公共IP地址的转换。该方案的主要缺点,一是由于采用了特殊的硬件,使得整个系统中存在非工业标准部件,极大地影响系统的扩充、维护和升级。二是价格极其昂贵,与软件的解决方案根本是数量级上的差别。三是只能实现对节点系统一级的状态检查,无法细化到服务器一级的检查。

协商式处理:协商式处理又叫并行过滤。这种方案的原理是客户请求会同时被所有的节点所接收,然后所有节点按照一定的规则协商决定由哪个节点处理这个请求。该方案中比较显著的特点就是整个群集中没有显著的管理节点,所有决定由全体工作节点共同协商作出。这种协商式处理方案的特点是,一、由于各节点间要进行的通信量太大,加重了网络的负担,一般需要增加节点通信的专用网络,这又反过来加大了安装维护的难度和费用;二、由于每个节点都要接收所有的客户请求并进行分析,所以加重了网络驱动层的负担,降低了节点本身的工作效率,同时也使网络驱动层很容易成为节点系统的瓶颈; 三、由于要更改网络驱动层的程序,所以并不是一个通用方案,只能够实现对特殊平台的支持;四、在小量节点的情况下协商的效率还可以接受,一旦节点数量增加,通信和协商将变得异常复杂和低效,整个系统的性能会有非线性的大幅度下降。所以此类方案,一般在理论上只允许最多十几个节点;五、无法实现异地节点群集; 六、由于群集内没有统一的管理者,所以可能出现混乱的异常现象。

流量分发:流量分发的原理是所有的用户请求首先到达群集的管理节点,管理节点可以根据所有服务节点的处理能力和现状来决定这个请求分发给某个服务节点。当某个服务节点由于硬件或软件原因发生故障时,管理节点能够自动检测到并停止向这个服务节点分发流量。这样,既通过将流量分担而增加了整个系统的性能和处理能力,又可以很好地提高系统的可用性。

在流量分发中,通过将管理节点本身做一个群集,可以消除由于管理节点自身的单一性带来的单一故障点。当然,在某些流量分发系统中,由于所有客户流量都要通过管理节点,也很容易使管理节点成为整个系统的传输瓶颈。但现代新系统,如TurboCluster Server,由于可通过直接路由或IP隧道转发机制,成功地解决了这个问题,使得所有对客户响应的流量都由服务节点直接返回给客户端,并不需要再次通过管理节点。

流量分发的具体实现方法有直接路由、IP隧道和网络地址转换三种。先进的TurboCluster Server系统支持效率最高的前两种,由于这种先进的结构和技术,使得Turbo Cluster Server群集内的服务节点数并没有上限,而且对大量节点的协同工作的效率也能够非常好地保证。

Link: http://www.asm32.net/article_details.aspx?id=586