《政府行业基于华为高端存储容灾解决方案.docx》由会员分享,可在线阅读,更多相关《政府行业基于华为高端存储容灾解决方案.docx(58页珍藏版)》请在课桌文档上搜索。
1、1前言政府行业的电子政务等系统建设关系到民生的保障。近几年来,由于自然灾舌以及人为误操作等因素给电子政务等系统造成的损失除了导致业务无法正常进行外,还给国家和百姓生活带来损失。大多数政府行业用户已经认识到容灾对于数据保护和实现业务连续性的重要性和必要性,但是由于容灾技术的豆杂性以及容灾实施与管理的难度高等因素,存在仅做数据容灾,或者容灾系统建设完成后面临管理豆杂和运维难度高等问题.那么如何才能建立一个架构简单、安全可症又易于管理的容灾系,保证电子政务等系统的持续运行呢?在做好本地数据备份的基础上,选择基于高端存储的应用级容灾方案是一个不错的选择.在保证关犍业务数据的安全,同时在发生故障时,可以
2、在同城/异地的容灾中心迅速启动灾备系统,接管生产中心业务,保证业务的永续运行.对于关系到民生的关键政务系统应用而言,仅仅建设数据级灾智只是在灾难发生时保证了数据备份存放作用,并不能直接使用继续提供可持续性的服务.因此在数据级灾备的基础上建立应用级灾备体系至关重要,对关健核心应用系统进行基制,在同城/异地灾备中心再构建一套应用支撑系统.支撑系统包括数据备份系统、备用数据处理系统、备用网络系统等部分.应用级灾备能提供应用系统接管能力,即在生产中心发生故障的情况下,灾备中心便能够接管应用,从而尽量减少系统停机时间,提高业务连续性.在应用级灾备系统建设中,应该综合考虑数据与应用系统的串要性、业务关联度
3、、技术成效度、基础设施条件、成本和管理维护等一系列因素.在应用级灾备系统中,不管是生产中心还是灾备中心,他们之间的业务都是有联系的.比如数据库必须先启动,之后才能启动应用程序,应用服务器接管完成,才能进行网络的切换,只有严格按照应急流程操作,才能确保应用及灾密建立及正常运行。2项目背景某部委按照有关要求进行电子政务信息化建设,到目前为止按照整体规划要求,完成了多个电子政务系统的建设,90%以上的业务已经全部纳入信息化管理,为某部委的信息化建设提供了强有力的技术支持并做出了巨大的贡献.由于信息化系统的建设是分块、分批建立起来的,目前仍三个系统中的数据不能共享、大量的相关和交叉业务不能协同处理。系
4、统分别运行,不能实现统一数据,也就实现数据的统一共享和使用。因此,需要将三个系统的数据进行统一整合.整合后的系统将现有系统的数据合为一体,形成全市统一的集中式数据库,真正做到统一数据.相关业务和交叉业务协同办理,独立业务分别办理,统一入口、统一出口.在一个数据庵中同时记载数据处理过程中的所有信息,在同一个信息源实现“数据共享。整合后的数据库将彻底解决在业务处理中相互依存、信息相互借用的问题,保证了数据的唯一性和准确性,把某部委的管理水平提升到一个全新的高度,简化了流程,提高了政府办事效率,真正做到”让数据多跑路群众少跑腿”,实现了80%以上业务网上申报,大大减轻和节省了经办人员成本,使之能有更
5、多的时间和精力深入街道、社区进行社会宣传及点对点服务.3现状和需求分析3.1 系统现状分析核心电子政务系统全部在等级保护三级及以上。全部是面向公众服务、关乎国计民生的重要信息系统。用户系统平台种类众多,涵盖所有主流品牌的操作系统,包括HPUX、IBMAIX.SUNSO1.ARIS和WindowsServer平台.用户应用系统采用的数据库集中在ORAC1.E、MSSQ1.和IBMDB2用户生产环境内数据存描类型和品牌各不相同,有服务器硬盘存储、NAS,DAS.SAN等;品牌包括】BM、HP、EMCxHDS.SUN、富士通、华赛等.数据管理模式不同,有集中存放及分散存放.各用户备份方式不同,有光盘
6、备份、喊带备份、磁盘备份,备份数据量和存阵总量差别较大.3.2 项目需求分析某部委目前已有比较完善的数据中心及相关应用,部署了服务器、存储、网络等设备.但是随若本次电子政务系统的建设和多个系统数据的整合,单体系统的数据量急剧增加,数据保护的重要性也随之提高.如何进一步提升电子政务系统的可靠性和降低系统停机时间成为了优先考虑的问题,对于容灾系统建设迫在相睦.被逐渐提上日程.在容灾系统建设方案上,由于本期项目整合的政务系统核心数据涉及到大员敏感的公民个人隐私信息,数据需要存储在本地数据中心,需要建设基于本地数据保护的容灾系统。在容灾系统建设前需要通过风险分析及业务影响分析等手段对业务和数据的风险进
7、行分析,确定容灾系统建设的方向和目标.容灾系统建设的需求分析主要包含风险分析和业务影响分析.进行风险分析,识别可能造成业务中断的灾难、具有负面影响的事件等因素,可控的风险与控制范围以外的风险,确定由这些风险可能造成的直接经济损失,确定业务系统的弱点,明确防危控制风险的技术和管理措施:进行业务影响分析,识别关健业务以及业务的优先级,识别由于业务中断造成的直接和间接后果,确定业务中断的影响程度,确定可以接受的损失范围,关键业务恢复的优先顺序以及恢且时间目标。3.2.1 风险分析对于某部委来说,风险分析的范围主要考虑所在地区的交通、电讯、能源及其他关键基础设施遭到严圭破坏,或各部门数据中心发生硬件故
8、障、天灾或人祸等灾难后所面对的可能性风险,同时还关要考虑各部分信息系统中断所造成的系统性风险.根据之前调研的结果,目前某部委信息系统应用中,数据的可免存放和备份主要存在缺乏针对自然风险(火灾、地赛、水灾等)、技术风睑(电力、网络和设备故障等等)和人为风险(人为操作失误、系统软件BUG、病毒、黑客等)的全面而有效的数据保护措施和恢复手段.经过风险分析,得出的风险因素如下:风险因素风险发生比率自然风险(5%)火灾(机房)3.5%水灾1.3%地震0.2%技术风险(35%)电力8%网络11%设备故障16%人为风险(60%)误操作40%病毒、黑客15%其他风险5%1、自然风险自然风险包括机房由于电力、雷
9、击或人为原因造成的火灾.由于地面沉降导致寡雨内涝、风星潮、地赛等自然灾舌:2、技术风险某部委各部门业务数量众多,机房环境和应用环境非常欠杂,随着业务需求的不断变化和数据大集中的建设,对各部门数据中心的应用和管理带来极大的冲击.数据大集中在带来种种好处的同时,也带来了风险的相对集中,这就对网络和管理提出了更高的要求.早期各级部门的分布式结构,出了问题只会对局部造成膨响,范围有限,管理上往往是被动管理模式,只有等到设备出现了问题才去进行紧急处理,这种方式已不适合数据大集中模式.由于数据的集中处理,一旦数据中心出现电力、网络和设备故障等问题就会在一个很大的范围内产生不利影响.需要各部门采取主动管理的
10、工作方式,未雨绸缪,提前预判、预防,井建立应急体系.一旦出现问题,能在极短时间内恢豆系统运行.否则,业务的中断与数据的丢失可能会带来巨大的经济和信誉损失与严函的负面影响.为了预防大集中模式数据的丢失,需要通过数据备份、异地灾备等数据安全手段保护数据的安全.根据目前某部委的现状,目前数据总量约为120T;数据备份技术主要为本地数据备份.现有普通的备份和恢豆手段实现不能够满足新的业务需求,需要更安全的和更易于管理的容灾解决方案.3、人为风险某部委信息系统软硬件设施型号、版本和品牌数量众多,涵盖的应用及数据的种类也非常多,应用系统平台豆杂,操作系统有Windows.Unix、1.inUX等,数据库有
11、Orade、DB2、SQ1.SERVER.MYSQ1.等.由于设备品牌,操作系统和数据库类型的不同,难免会出现人为操作失误、系统漏洞,病毒攻击和黑客入侵等问题,造成由大故障,影响数据安全.根据各个业务系统不同部署情况对容灾保护的为求也各不相同,其中的数据也都有不同层次的容灾需求.3.2.2 业务影响分析业务影响分析主要是对存在风险的业务系统的功能、以及当这些功能一旦失去作用时可能造成的损失和影响进行分析,以确定单位关键业务功能及其相关性,确定支持各种业务功能的资源,明确相关信息的保密性、完整性和可用性要求,确定这些业务系统的恢宜需求,为下一阶段制定灾难恢复策略提供基础和依据.某部委的核心主机设
12、备为高性能四路服务器及SAN存储等设备组成,大部分设备使用年限已超五年,老化严重,出现故障的几率非常大。核心数据库存储系统资源的利用率已到达85左右,月底月初时数据访问量大,存储资源的访问频率更高,响应时间变长.而且隐着使用人群的增加和新业务需求的增长,同时也考虑到未来几年的新业务增长和业务豆杂度的增高,现有存慵设备已不能完全满足.目前存储系统为单节点部署,如果一旦宕机,会导致该业务系统提供的社会职能瘫痪,严再时给社稷民生带来灾难性后果,进行容灾建设,对数据进行保护,对业务系统连续性进行保护,是非常必要的.3.3 痛点分析在数据保护方面,某部委本地数据中心制盘阵列采用SAN存储架构,通过备份软
13、件实现了本地数据备份。但是本地数据保护只能应对小规模的逻辑错误,而且恢豆时间比蛟长,无法做到实时的应用保护和数据保护.而且一旦本地机房发生火灾、地震等自然灾吉,所有数据将全部丢失,严由威胁公民信息安全.另外,由于多库合一的系统建设,需要容灾系统保持高性能、高可用、资源高度整合和可持续发展。实现关撼应用系疣的业务连续性,实现核心业务系统应用级容灾的要求,满足未来五年某部委业务的稔定和快速发展.由于某部委的数据关系到民生数据安全,需要实现零数据丢失”,确保在灾难发生时数据不会丢失.容灾系统建设后,需要实现同城/异地灾备中心容灾系统数据安全,实现业务系统应用快速切换,确保在灾难发生时,容灾中心能移快
14、速接管生产中心应用系统,继续对外进行服务,4建设内容分析4.1 指导思想某部委容灾系统建设应以科学发展为主题,以提升可持续发展能力为目标,以实际需求为导向,以节约资源和保障数据安全为若力点,遵循电子政务业务发展规律,发挥容灾系统的优势,完成合理规划、按需设计、按标建设,逐渐形成技术先进、结构合理、协调发展的容灾数据中心新格局.4.2 建设原则项目建设应充分考虑实际需求和技术发展,以实现系统统一管理、高效应用、平滑扩展为目标,以先进、安全、成熟、开放、经济”为总体设计原则.(一)先进性原则:在系统总体方案设计时应优先考虑基于国产品牌产品的先进方案和技术,确保一定时间内不落后.选择实用性强产品,模
15、块化结构设计,既可满足当前的需要又可实现今后系统发展平滑扩展.(二)安全性原则:容灾系统数据某部委重要信息系统的最终保障,不但要保证能够7X24运行,而且必须有高可用性.在迸行系统设计时,充分考虑数据高可靠存储,采用高度可靠的软硬件容错设计,进行有效的安全访问控制,实现故障屏蔽、自动冗余更建等智能化安全可靠措施,提供统一的系统管理和监控平台,进行有效的故障定位、预警.(三)成熟性原则:为确保整个系统能终稳定工作,灾备系统平台应使用先进、完善、易于管理和稳定可靠的数据存储系统、网络系统和容灾管理系统。(四)开放性原则:系统建设具有开放性的标准体系,提供符合国家灾省建设标准的容灾等级保护系统.(五
16、)经济性原则:某部委现有业务系统存硫数据量较大,目数据的增长速度较快.因此在建设灾备系统存储架构时,应从长远的角度考虑,建设一个长期的存储架构,除了可以应对存储硬件设备的升级速度外,还必须考虑到对前期存磕设备的投资保护,在保证不断提供功能和性能提高的同时,存储架构在较长的时间内能够保持相对稳定.同时充分考虑应用发展方求,实现系统可弹性在线平滑升级,节约和降低系统建设的硬件成本.4.3 建设依据近年来,国信办和我市出台的有关信息化发展规划和信息系统建设要求的相关文件多次指出,各地要建立容灾中心,实现数据级容灾备份,有条件的应实现应用级容灾备份.1、2004年9月,国家网络与信息安全协调小组办公室
17、又出台了关于做好重要信息系统灾难备份工作的通知(信安通2004ll号文件),通知提出要提高抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业连续性,避免引起社会重要服务功能的严至中断,保障社会经济的稳定;要加速推进对国计民生有重大影响的机构、行业的灾备建设,要在灾难出现时认真做好应急预案与灾难备份,将里点行业的灾难备份问题提到了更高的层次.2、2005年4月,国信办出台了关于印发正要信息系统灾难恢复指南”的通知(国信办20058号文件)3、2007年11月,国冢标准信息安全技术信息系统灾难恢复规范正式实施,规范明确了军要信息系统灾难恢豆应遵循的基本要求
18、,从原则、技术、规划、管理等层面给予了指导,指明了灾难恢聂工作的流程、灾难备份中心的等级划分及灾难恢且预案的制订框架.4、2006-2020年国家信息化发展战略(中办发200611号)提出生视灾难备份建设,增强信息基础设施和正要信息系统的抗毁能力和灾难恢复能力5、等保20信息安全技术网络安全等级保护基本要求双GB/T22239-2019)将信息系统的保护级别划分为五级,1-5级均要求提供由要数据本地数据备份与恢且功能;3-5级要求提供异地实时备份功能,利用通信网络将蚤要数据实时备份至备份场地,并要求重要数据处理系统热冗余,保证系统的高可用性(即业务连续性要求).6、关键信息基础设施安全保沪条例
19、(2021年7月30日国务院令第745号公布,2021年9月1日起施行)第二条规定:本条例所称关键信息基础设施,是指公共通信和信息服务、能源、交通、水利、金融、公共服务、电子政务、国防科技工业等重要行业和领域的,以及其他一旦遭到破坏、丧失功能或者数据泄露,可能严里危害国家安全、国计民生、公共利益的至要网络设施、信息系统等.关健信息基础设施安全保护条例第五条规定:国家对关檐信息基础设施实行至点保护,采取措施,监测、防御、处亘来源于中华人民共和国境内外的网络安全风睑和威胁,保护关键信息基础设施免受攻击、侵入、干扰和破坏,依法惩治危害关键信息基础设施安全的违法犯罪活动.4.4 建设内容本期项目建设的
20、核心内容是构建电子政务系统的同城/异地容灾中心,对电子政务等核心系统和数据进行应用级容灾保护,最终构建一个科学合理的同城/异地容灾中心。本次项目建设内容主要分为三个部分,分别是容灾基础设施建设、应用级容灾系统建设和灾难预案与运维体系建设,具体内容如下:容灾基础设施建设:完成容灾环境存储系统的建设,基础网络环境建设,主机和链路等基础设施的建设。应用级容灾系统建设:完成关键业务系统应用级容灾建设,通过跆中心的应用系统集群建设,实现零数据丢失,业务中断后能塔进行快速切换,保证业务的连续性.灾难恢聂预案与运维体系建设:为确保容灾系统稳定、可靠的运行,达到项目建设预期的效果,需要建立容灾系统配套的灾难恢
21、豆预案与运维管理体系.5建设需求总结本次项目的建设是规划且杂程度高、建设周期长、运维难度高的一个项目.并且建设过程是一个周而宜始和持续改进的过程.依据国家标准信息安全技术信息系统灾难恢豆规范,建设和管理灾难恢豆系统的工作.在项目建设过程中,主要包含以下几个方面的内容:1,灾难恢良需求的确定:通过风险分析及业务影响分析的结果,确定灾难恢且的目标.2、灾难恢且策略的制定:根据灾难恢宜需求、技术手段的可行性、资源获取方式确定灾难恢复策略和方案.3、灾难恢良策略的实现:根据既定的策略和灾难恢且等级制定具体的技术方案.架构设计篇1容灾架构设计要点容灾架构的设计主要内容是对灾难恢复策略的制定,需要依据信息
22、系统灾难恢复规位,根据灾难恢豆需求、技术手段的可行性、资源获取方式确定灾难恢豆策略和方案.1、需要选择合适的灾备等级时,但是同时也需要考虑投资回报率.对于本期项目而言,某部委的核心电子政务系统对于政府业务的正常运行至关电要,一旦数据大盘丢失或业务长时间中断,造成的影响是无可估量的.对于这些核心业务系统,往往选择等级五或等级六的应用级灾备,虽然投资较大,但是与风险造成的影响比较起来是相称的.而对于一般业务系统,发生灾难所带来的损失没有核心业务系统影响大,因此完全没有必要一味追求高的灾苗建设等级,而是可以结合自身条件建设不同容灾级别.2、各部门业务单位中的不同业务系统,可采用不同的灾难恢且策咯。核
23、心业务的灾备等级选择了等级五或等级六,非核心业务系统可以采用不同的级别.风险给不同类型的业务所带来的损失是不同的,因此不能采用一刀切的方式进行灾备系疣建设,而是需要细致分析业务单位信息系统的重要程度,有效区分核心业务和非核心业务,井平衡业务系统的实际需求和总体成本的关系,不具体灾备条件的业务系统视条件成熟再逐步考虑。因此,各部门单位在进行灾备系统建设时,需要根据业务系统里要性的不同,采用不同的灾备等级.在进行灾备规划时,单靠一种方案或一种技术是行不通的,为了实现多种灾备等级,需要有一个完整的灾备技术体系作支撑.3、容灾技术架构选择要适合现阶段的基础设施环境,并且考虑未来的技术路线和发展.灾备的
24、关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏,较低等级的灾备可通过备份软件实现数据的异地存放,而较高级的灾备则依靠基于网络的数据豆制工具,实现同城/异地数据中心与生产数据中心之间的同步的数据传输,例如采用基于高端磁盘存储的同步/异步数据且制功能.在灾备建设中,是选择数据级容灾还是应用级容灾需要从灾备的目标,投入产出比等多个角度进行分析。2灾难恢算需求的确定2.1 灾难恢且级别灾难恢复等级的确定是信息系统灾备建设的正要考虑因素.规范将灾难恢复能力划分为6个级别:等级一:基本支持.要求数据备份系统能够保证每周至少进行一次数据备份,备份介质能够提供场外存放,对于备用数据处理
25、系统和备用网络系统,没有具体要求.等级二:备用场地支持。在满足等级一的条件基础上,要求配备灾难恢聂所需的部分数据处理设备,或灾难发生后能在预定时间内调配所需的数据处理设备到备用场地;要求配备部分通信线路和相应的网络设备,或灾难发生后能在预定时间内调配所需的通信线路和网络设备到备用场地.等级三:电子传输和设备支持.要求每天至少进行一次完全数据备份,备份介质场外存放,同时每天多次利用通信网络将关键数据定时批量传送至备用场地。配备灾难恢爰所需的部分数据处理设备、通信线路和相应的网络设备.等级四:电子传输及完整设备支持.在等级三的基咄上,要求配置灾难恢豆所需的所有数据处理设备、通信线路和相应的网络设备
26、,并且处于就绪或运行状态。等级五:实时数据传输及完整设备支持。除要求每天至少进行一次完全数据备份,备份介质场外存放外,还要求采用远程数据复制技术,利用通信网络将关犍数据实时豆制到备用场地。等级六:数据零丢失和远程集群支持.要求实现远程实时备份,数据零丢失;备用数据处理系统具备与生产数据处理系统一致的处理能力,应用软件是集群的“,可实时切换.2.2 RTo和RPO目标信息系统灾难恢且能力等级与恢巨时间目标(RTO)和恢巨点目标(RPO)具有一定的对应关系,各行业可根据其行业特点及信息技术的应用情况制定相应的灾备等级要求和指标体系。在规范中,也给出了某个行业灾难恢且能力等级与RT0、RPO之间关系
27、的示例,可作为参考:灾难恢巨能力等级RTORPO12天以上1天至7天224小时以后1天至7天312小时以上数小时至1天4数小时至2天数小时至1天5数分钟至2天0至30分钟6数分钟0需要指出的是,在灾备等级六中,RTO是数分钟而不是0.在实际的灾备建设中,部分的用户对此存在误区,认为等级六(或者说应用级灾备)就一定要达到RTO为0,即应用自动切换。从技术层面而言,目前的远程集群技术能够达到应用自动切换的目标,但是这种方式的弊端在于,多种潜在因素(例如集群服务器心跳线中断、网络短时间中断、应用服务器响应不及时等)容易导致在生产中心实际运行正常情况下进行误切换,运行风险高.我们知道,灾备中心的应用接
28、管是一个管理和决策的过程,需要人为参与,无法完全交给机器和软件来替代完成的。一旦灾堆发生,在人为决策后,将灾备中心服务器启动或恢聂对外访问,通过几分钟实现业务的快速切换,既能够达到高等级的灾备建设目标,又能避免误切换的巨大风险。通过对规范中该行业灾备建设RTO建议的研究,我们可以看到选择等级六时,数分钟”的切换时间目标是非常科学和理性的。2.3 灾难恢复资源要索在明确了灾备建设中灾难恢且能力等级和RT0、RPO目标之后,另一个更要问题是在具体建设中应该考虑哪些资源要素.我们把规范中灾备建设内容的描述称之为灾备建设的七要素:序号要素要素的考虑要点1备用基础设施灾难备份中心选址与建设;备用的机房及
29、工作辅助设施和生活设施;2数据备份系统数据备份范围与RPO;数据备份技术;数据备份线路;3备用数据处理系统数据处理能力;与生产系统的兼容性要求;平时的状态(处于就绪还是运行);4备用网络系统备用网络通信设备系统与备用通信线路的选择;备用通信线路的使用状况;5灾难恢豆预案明确灾难恢豆预案的:A)整体要求B)制订过程的要求C)教育、培训和演练要求D)管理要求6运行维护管理能力运行维护管理组织架构;人员的数量和素质;运行维护管理制度;其他要求;7技术支持能力软件、硬件和网络等方面的技术支持要求;技术支持的组织架构;各类技术支持人员的数量和素质等;通过对规范所定义的七要素的细致分析,我们不难发现,灾备
30、建设实际可以归纳为三个步蟋:第一步是建设灾备中心,主要考虑要素一即基础设施建设,包括灾备中心的选址与建设,备用机房、工作辅助设施和生活设施的建造等;第二步是在灾备中心建设完成后,至点考虑如何将生产中心的数据同步到灾备中心,具体的讲就是考虑要素二、三和四,即数据备份系统、备用数据处理系统和备用网络系统;第三步,就是日常的运维和管理,即要素五至七.这三个步骤之中,基础设施建设、日常的运维管理属于灾备的基础支撑系统,业界有很多成熟的标准和体系可以借鉴。从技术的角度来说,最豆杂的内容就是两个数据中心的同步,面临了很多技术上的选择难题,这也是传统灾备系统建设豆杂性的根源所在,需要电点考虑规划。规范中对七
31、要素的详细定义,还可以引导灾备建设单位全面考虑灾难恢复建设的各个相关方面,防止片面强调个别要素而忽略整体。例如,大部分单位在进行灾备建设时,三“硬而轻“软”,对于备用基础设施、数据备份系统.备用数据处理系统和备用网络系统充分亚视和关注,而对于日常运维、灾难演练等有所忽略.灾备系统建设完成后,几年都没有迸行演练,灾备的建设目标是否达到、灾难应急流程是否完善、数据恢豆后是否可用等等都无法确定,花了巨资建设的灾备系统的效果自然也大打折扣.由此可见,灾难恢豆能力等级越高,对于信息系统的保护效果越好,但同时成本也会急剧上升.因此,目前我们建议政府行业数据级灾备体系应至少达到了等级三的国家标准即,每天至少
32、进行一次完全数据备份,备份介质场外存放,同时每天多次利用政务外网将关键数据定时批量传送至灾备中心。同时配缶灾难恢复验证时所需的部分数据处理设备、通信线路和相应的网络设备.目前各市级委办单位在进行灾备系统规划建设时,由于场地、资金、技术能力等因素,无法统一有效的建立完整的应用级灾备体系,往往顾此失彼.因此根据各委办单位业务系统重要性的不同,采用不同的灾备等级、以及选择合适的灾备技术成为了迫在眉睡需要解决的问题.这也说明了在进行灾备规划时,单靠一种方案或一种技术是行不通的,为了实现多种灾备等级,需要有一个统一完整的灾备技术体系作支撑.3灾难恢复策略的制定3.1 策略制定分析依据信息系统灾难恢且规范
33、,灾难恢且能力等级越高,对于信息系统的保护效果越好,但同时成本也会急剧上升.因此,灾备建设中,如何确定业务系统的合理的灾畜恢豆等级是一大难题.在信息系统灾难恢复规范中也指出了,可以根据成本风睑平衡原则(即灾难恢复资源的成本与风睑可能造成的损失之间取得平衡)来确定.在本项目中针对业务连续要求较高的核心电子政务系统将采用应用级容灾,容灾等级为5级或6级.应用级容灾主要焦点在于客户的内部业务互相关联性,因此应该是对一个业务群体进行容灾部署,而不单单是对一个应用系统.为了实现应用级容灾,需要建设新的数据存储和数据系制体系,所有业务系统数据豆制方案要求采用统一机制,部署新的数据存储设备分别放芭在本地数据
34、中心和同城/异地灾备数据中心.基于成本性能考虑、应用容灾的构建、管理以及便于容灾演练,基于政策和数据安全的考虑,全部的数据以及副本将存储在本地存慵设备中,电子政务云平台仅可获取到部分必要的数据.3.2 策略制定设计3.2.1 策略制定技术分析技术分析是灾备恢豆策略制定设计的基础,灾备技术与灾备恢豆策略匹配程度的高低,决定了容灾系统对数据中心生产环境的数据和应用系统的可替代程度,对于高效实现灾难恢豆,提高容灾系统可用性有更要意义.容灾系统技术建设是一个整体,其涉及到各个层面,如下图:1.AN应用系统应用系统数据库系统卷管理系统件国*整SAN数据库系统卷管理系统SAN1.AN存储系统存储系统i网络
35、系统MSS髅款配冷1.网络系统上备中心-ACtiVe主中心-ACtiVe从容灾涉及的层次来看,主备数据中心的容灾技术主要分为5个层次,分别为备用网络系统、数据存储系统、卷管理系统、数据库系统和应用系统,主要技术分析如下:备用网络系统:通过网络多IS路连接、以及动态路由协议实现容灾快速切换.数据存储系疣:通过构建两个独立的光纤存储系统、数据同步复制和动态多路径软件,实现数据零丢失。卷管理系统:在主备数据中心,通过卷管理软件保证数据的一致性和完整性.卷管理软件根据容灾技术策略的不同,可以由基于主机的卷管理软件或基于存硫的卷管理软件实现.数据库系统:通过保障主备数据中心的数据南一致性和完整性实现容灾
36、.应用系统:通过虚世化、负载均衡等设备对应用系统实现热切换,实现应用系统在主备数据中心服务器的应用级容灾实现.根据以上对容灾5个层次的技术分析,卷管理系统和数据库系统依赖容灾巨制技术的选择,如果选择基于存储系统的容灾方案,那么就不需要考虑这两种技术方案的实现。应用系统的容灾切换主要依赖上层应用的具体实现方案,所以本期容灾项目建设的难点主要集中在备用网络系统和数据存储系统的技术选择上,下面将对其进行深入探讨。3.2.2 给用网络系统本地数据中心和同城/异地灾备中心之间在网络上形成一个整体,所有的业务系统均可同时在多个数据中心运行,为业务提供服务。同城灾备中心通常采用光纤搬路进行连接,异地灾备中心
37、由于距寓较远,可以采用IP网络,采用ATM或E1.E3线路.当其中一个数据中心的业务系统出现故陪时,由另一个数据中心的业务系统持续提供服务.数据中心之间具体的带宽要根据业务量峰值、距离、应用系统高峰时的写I/O的数量、写I/O块的大小、应用系统所能承受的响应时间的延迟、生产与备份中心之间的距离来计算.具体要求如下:城域网要求:(同步远程豆制)容灾距离:20Okm;传输延迟:lms(单向).广域网要求:(异步远程豆制)容灾距离:无限制;传输延迟:50ms(单向).在本项目中,同城数据中心相距10公里左右,需要实现存储双活和业务系统快速切换,对通讯线路的带宽和可靠性要求比较高,采用了4台华为DWD
38、M波分设备,对主链路对应的关犍系统和应用互联提供冗余备份。整个网络主要包含业务专网、公共服务区网及管理网络建设.而异地灾备中心之间则采用了622MSDH线路。3.2.3 数据存储系统(一)数据传输的技术选獐数据备份传输的主要方式有异步短制、同步复制。数据备份传输方式的选择主要取决于灾备需求分析中业务系统对RPO的要求.异步复制同步且制原理通过缓存与批最处理的方式,将数据中心生产数据且制到灾备中心同时对生产中心与灾备中心的数据进行同步写入的豆制技术。在灾备中心数据成功写入前,数据中心存储系统将不处理后续的I/O请求数据备份空间多多适用RPO分钟级笔秒级对生产系统影响无密切同城数据中心之间相距较近
39、,根据项目需求,要求RPO较高,数据丢失量要求为0,所以建议采用同步数据传输模式,但是必须要求裸光纤链路才不会对数据读写产生影响.异地灾备中心机房部署距离较远,由于对RPO要求较低,要求为分钟级,所以建议采用异步数据传输模式,数据传输链路采用广域网。(二)数据复制的技术选择目前数据豆制技术主要有两种实现模式:基于主机/数据库代理模式和基于存储豆制模式.这两种模式的选择主要取决于灾备恢欠需求与可用于灾备建设的资源投入.结合某部委的信息化现状,各部门单位主机系统、应用软件和存储设备异构环境复杂,需要根据实际情况选用合适的数据宜制技术.在数据复制的技术选择上要求支持异构环境,满足各部门单位RPO时间
40、要求,综合考虑投资建设性价比.主要对比如下:1、主机/数据障代理模式灾各中心生产中心异步方式冏步或眼务器存储在主机上安全备份客户端,基于文件和数据库日志文件的数据算制,仅能提供有限的数据的保护占用主机资源,影响生产系统性能受到操作系统、数据库、存储系统兼容性限制灾难发生后回切,需要一系列人工操作,RTo小时级一般采用异步数据豆制服务器(应用程序)文件系统数据库卷管理器I远程数据复制IMuni2、存储豆制模式存储,基于同构存储间数据豆制间数据复制P同步或异步方式4一存储切换与回切如果使用存储虚拟化卷管理设备,可以实现异构存储逻辑卷实时数据镜像,不占用主机资源覆盖所有数据对英高效总制性能,低实施和
41、维护成本双向豆制,可实现数据级、应用级容灾切奂与回切主要对比说明如下:主机代理模式存储复制模式原理依托在业务主机中的备份软件,对数据备份传输过程进行管理,并通过业务传输网络传输到灾备中心通过专用存储传输网络,实现数据中心存储与灾备中心存储之间数据复制技术限制主机需部罟客户端要求相同型号存储或将存储虚拟化典型复制技术数据麻豆制技术文件欠制技术等存储阵列豆制技术SAN虚拟化复制技术资源占用情况占用一定主机资源,影响业务网络基本不占用主机资源,不影响业务网络适用备份方式异步备份同步备份或异步备份建设投入较低高,需专用存储网络设备或购置同型号存储数据备份效率一般很高适用RPO分钟级30分钟以上亳秒级别
42、在本项目中,根据实际政务系疣需求,为了避免部署多个主机/数据库代理系统,实现统一的数据复制和备份,将采用基于高端磁盘存储的数据豆制模式.4容灾架构设计总结容灾架构的设计主要依据需求分析的结果进行具体的容灾架构设计工作。依据信息系统灾堆恢至规范,我们根据某部委各部门单位的政务系统部署平台的情况、应用之间的数据依赖关系、应用正常运行需要数据量、应用正常启动和异常启动需要的时间等关耀因素,确定了各个电子政务系统所需要实现的容灾恢豆等级.在确保容灾系统建设满足现有数据中心技术架构的前提下,又通过对多种不同的数据复制方案和技术路线进行了比较,确定了本期项目的容灾技术架构和路线,明确数据复制采用的技术手段
43、和方案,确定容灾恢复所标要的软硬件设备类型和数量,为最终完成容灾系统建设提供了技术决策.方案实现与效果篇1容灾方案实现要点容灾方案的实现主要是根据既定的策略和灾难恢复等级制定具体的技术方案.本期容灾项目建设的总体需求是构建以电子政务等核心业务为主要的容灾保护系统.依据建设需求分析我们已经制定了具体的技术实现策略并确定了灾难恢宜的等级.本期容灾项目建设的总体灾难恢系策略主要是实现本地数据存储中心,实现对本地数据的保护.灾难恢豆等级政务核心系统主要以6级为主,其他非核心业务系统依据需求分析确定为5级和4级.根据确定的灾难恢宜策略和容灾级别建设同城/异地灾备中心,对电子政务核心业务系统进行应用级容灾
44、保护,最终构建一个科学合理的容灾系统.在具体方案实现过程中除了需要满足本期容灾项目的建设需要,还需要考虑实际的基础设施环境并满足未来3-5年的业务发展需要。特别是在容灾数据保护方面.要考充分考虑多个不同地域的远距离数据传输问题、数据一致性和数据恢欠等问题.在确保数据安全的前提下保证电子政务系统的业务连续性。2灾难恢复策略的实现2.1 总体实现设计根据本期项目的总体技术规划,核心存储均构建在高性能SAN存储上,并根据业务特点采用不同性能的存储介质.所有数据中心存储设备均连接到SAN网络.业务系统通过得份系统进行本地系统备份,从而保证本地系统的备份与恢聂,通过这样一个高性能存储的架构设计,可以有效
45、的某部委现有和未来的电子政务业务.根据方案规划,本次项目建设中存储系统将实现以下功能:本地数据存储:本地部署高性能存硫设备并做好本地数据备份。同城容灾存储:本地/同城数据中心所有数据都存在各自数据中心的存储上,两数据中心存储互为双活,两份数据,实时同步.异地数据备份:核心数据通过远程链路备份到异地容灾中心,进行数据备份和恢豆.2.2 具体实现方案基于政务行业的华为OCeanStorDorado18000系列高端存储容灾解决方案将提供统一节约的应用级容灾解决方案,将传统的分散、分屋、异构的传统数据中心架构,改造为全扁平式、点到点全互联、统一资源管理的云灾备数据中心架构.将不同地域、不同规模的委办
46、接入数据中心看做完全对等的节点,混合虚拟化(兼容物理和虚拟资源)为一个“逻辑资源池”,统一管理、统一呈现、统一运营。设计基于政务行业的华为OCeanStorDorado18000系列高端存储容灾解决方案将具有应用级容灾保护和远程数据级灾备保护的能力。可以为各部委和市级委办单位信息系统平台上运行的核心业务系统提供应用级容灾解决方案,针对不同的信息系统特点,建立统一接入、统一规划、统一管理的应用级灾备体系.拓扑结构图如下所示:2.3容灾系统架构容灾系统架构实现的基明是华为OCeanStorDorado18000系列高端存储.基于华为C)CeanStorDOradO18000系列高端存储建设存储资源池、各用户不同级别灾备服务接入、灾备服务按需提供和统一运维管理等内容.配合计算资源和网络,全面实现服务的落地,构建扩展性好、信息高度共享的灾备一体化系统。华为OCeanStorDorado18000系列存储系统是华为根据存储产品应用现状和存储技术未来发展趋势,推出的新一代高端存储产品,为企业核心业务提供展高水平的数据服务.随着电子政务系统的进步和业务的发展,不断培加、累积的政务数据对存储系统提出了更高的要求。但传统的存储系疣无法跟上其数据烟长的步伐,出现诸如存储性能成瓶颈,维护、扩容操作导致业务中断,冷热数据无法剥离,同等对待各种