双机热备方案
方案建议书
方案提供:XXXXXXXXXXX
日期:2010-10-23
双机热备方案详细描述
双机热备份技术
双机热备份技术是一种软硬件结合的较高容错应用方案。做双机热备有两种方式:
1、采用两台服务器及相应的双机热备份软件组成。如图1所示
图1
在这个方案中,操作系统和数据库程序安装在两台服务器的本地系统盘上,整个系统的数据存放在服务器的本地硬盘。数据管理是通过双机热备份系统,将所有的数据同时写入两台服务器硬盘,并由专业人员进行管理。用户的数据存放在本地硬盘中,在一台服务器出现故障时,备机主动替代主机工作,保证应用不间断。
2、采用两台服务器系统和一台磁盘阵列以及相应的双机热备份软件组成。
如图2所示:
图2
在这个方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中。在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。
双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络应用运行不间断。
双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。
双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入,保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。这是目前采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。
双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。配置相对要好。
双机双工模式:是目前cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San方式)。WEB服务器或FTP服务器等用此种方式比较多。
双机热备针对的是服务器的故障。
服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。而如果技术人员不在现场,则恢复服务的时间就更长了。
而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。
决定是否使用双机热备,正确的方法是要分析一下系统的重要性以及对服务中断的容忍程度,以此决定是否使用双机热备。即,你的用户能容忍多长时间恢复服务,如果服务不能恢复会造成多大的影响。
在考虑双机热备时,需要注意,一般意义上的双机热备都会有一个切换过程,这个切换过程可能是一分钟左右。在切换过程中,服务是有可能短时间中断的。
但是,当切换完成后,服务将正常恢复。因此,双机热备不是无缝、不中断的,但它能够保证在出现系统故障时,能够很快恢复正常的服务,业务不致受到影响。而如果没有双机热备,则一旦出现服务器故障,可能会出现几个小时的服务中断,对业务的影响就可能会很严重。
另有一点需要强调,即服务器的故障与交换机、存储设备的故障不同,其概念要高得多。原因在于服务器是比交换机、存储设备复杂得多的设备,同时也是既包括硬件、也包括操作系统、应用软件系统的复杂系统。不仅设备故障可能引起服务中断,而且软件方面的问题也可能导致服务器不能正常工作。
还应指出的是,一些其他的防护措施如磁盘阵列(RAID)、数据备份虽然是非常重要的,但却不能代替双机热备的作用
长远规划愿景
现有的数据中心是一个服务器、存储设备等资源的汇集,伴随着应用系统的发展,随时有数据的存储、访问、共享、保护等方面的要求,如:增加容量、服务器群集、数据共享、数据移动、备份和恢复等。如果在选择灾备中心存储基础结构时,没有考虑到异类服务器和存储设备的整合,就会在业务发展和数据增长时形成一个个“数据孤岛”。
数据孤岛阻碍企业健康发展
数据孤岛的主要表现为数据的一致性无法保证,由于信息定义与采集过程彼此独立,企业的同一数据可能在不同的应用中不一致。此外,还有信息及时共享、反馈难,信息不能及时充分共享的矛盾突出,企业中“信息孤岛”林立。信息的共享、反馈难,公司就无法适应当今快速多变、全球化竞争的市场环境,集团的生存和发展将面临极大的挑战。
另外,数据孤岛还会让企业数据中存在很大的冗余、大量的垃圾信息。而且信息需要重复多次的输入,对信息的多次采集不仅仅是额外的劳动,数据失真也是重复输入的恶果之一。
在企业外部,因为有着众多的数据孤岛,内外部的数据交换会遇到许多技术问题,造成企业与外部信息不对称。企业无法及时掌握外部市场、技术等方面的变化,信息不对称企业就无法创新,在全球竞争的经济背景下,如果不提到创新,那根本就不可能参与到全球的竞争中去。
最关键的问题是这些异构系统之间成为多个应用和数据的孤岛,难于共享数据和资源,相互之间不能互为数据备份,数据的完整性和可用性差,企业决策者无法集中看到所有关键数据,难于及时掌控各种准确有效数据,因而大大提高了企业营运成本,减弱了企业市场快速响应力,也大为降低中小企业综合竞争力。一些中小企业老旧IT系统甚至"陷于不义",产生自相矛盾、过时错误的数据信息,使企业在错误时间错误地点做出了错误的决策,贻害不浅。
集中存储备份方案
为了满足应用系统对于存储的需求,并考虑到性能、扩展性、可靠性等因素。解决“数据孤岛”,方案设计建设存储区域网络(SAN),来统一为应用系统提供存储服务。这样既可以有效的提高整套系统的存储利用率,简化管理和维护的工作量,并且有利于实现数据的集中备份;同时利用SAN-存储局域网的融合性和可扩展性,实现“服务器群-SAN网络-存储池”新一代IT架构,保护用户投资,降低用户的总拥有成本。
方案拓扑图:
两台数据库服务器采用双机热备,保证数据的安全;其他应用服务器和数据库服务器组成服务器群。通过两台SAN交换机组成数据专网。磁盘阵列作为数据存储设备,实现数据才集中存储,高效读取,而且方便管理。备份服务器安装备份软件,将磁盘阵列上的重要数据备份到磁带库,保证数据安全零丢失。
综述 通过双机热备,数据集中存储,磁带备份组成一个完整的高可靠应用,数据读取高效,安全管理的数据管理系统。