《完整版(2023年)智慧校园云数据中心方案.docx》由会员分享,可在线阅读,更多相关《完整版(2023年)智慧校园云数据中心方案.docx(49页珍藏版)》请在课桌文档上搜索。
1、完整版(2023年)智慧校园云数据中心方案第1章项目概况31.1 建设背3景1.2 建设目3标1.3 建设需4求1.3.1 设计原则41.3.2 建设思路5第2章云数据中心解决方案51.1 云数据中心框架设计51 .1.1云数据中心总体设计52 .1.2云平台总体架构61.2 计算资源池设计92. 2.1虚拟机的定义103. 2.2虚拟化技术选择114. 2.3计算资源池分类125. 2.4服务器容量规划146. 2.5虚拟机资源分配157. 2.6虚拟机的物理分布158. 2.7虚拟机模板设计169. 2.8高可用性设计1610. 2.9动态资源扩展(DRX)182.3存储系统建设252.3
2、.1存储需求分析252.3.2解决方案292.3.3方案基本优势302.4备份系统建设412.4.1方案架构412.4.2方案说明41第1章项目概况1.1 建设背景根据教育信息化十年发展规划(2011-2020年),到2020年,全面完成纲要所提出的教育信息化目标任务,形成与国家教育现代化发展目标相适应的教育信息化体系,基本实现所有地区和各级各类学校宽带网络的全面覆盖,基本建成人人可享有优质教育资源的信息化学习环境,教育管理信息化水平显著提高,教育信息化整体上接近国际先进水平,其次对教育改革和发展的支撑与引领作用充分显现。“数字化校园”的建设,已经为学校师生的学习、生活、科研提供了比较丰富的信
3、息,而“智慧校园”应当在“数字校园”的基础上,进一步挖掘信息资源的价值,实现智能化的推送,促进知识的智慧传播与分享。智慧校园发展的定位,要让信息化真正成为提升学校核心竞争力的手段。通过“智慧校园”项目的建设,可以提高学校的信息服务和应用的质量与水平,建立一个开放的、创新的、协作的和智能的综合信息服务平台。并且可以通过综合信息服务平台,实现各个系统的共享、整合,提高学校的信息化水平和工作效率。1.2 建设目标“智慧校园”是指通过利用云计算、虚拟化和物联网等新技术来改变学生、教师和校园资源相互交互的方式,将学校的教学、科研、管理与校园资源和应用系统进行整合,以提高应用交互的明确性、灵活性和响应速度
4、,从而实现智慧化服务和管理的校园模式。它的应用基础是要建立统一的数据服务平台,需要充分整合利用现有的应用系统和数据。对于学校数据中心整合信息化建设资源,充分利用现有基础设施,对业务数据中心业务平台进行调整、升级和改造,满足教务应用系统和教务管理服务需要。具体包括:采用云计算相关技术,结合创新建设模式,搭建标准统一、功能完善、系统稳定、安全可靠、纵横互通、集中统一的云计算平台,为各部门信息资源共享、数据交换和系统办公提供良好的支撑。通过建设云计算平台,方便未来将新增应用快速部署到云计算平台上,大大缩短新IT系统的上线时间,预期将节省设备30,节约能耗弧解决“信息孤岛”,实现信息共享,提高信息安全
5、水平,提高工作效率和公共服务水平,提供面向社会的专业性服务和为社会公众提供信息服务。通过降低成本、提升效率、节能减排,满足电子政务要贯彻落实科学发展观,转变发展模式的需要。满足在云计算平台上搭建应用系统的需要,包括以三层架构为主的应用系统,以及大访问量的应用系统、大数据处理量的应用系统以及大计算量的应用系统。1.3 建设需求1.3.1 设计原则标准开放为保证多厂商的良好兼容性,避免厂商技术锁定,方案的设计充分保证与第三方厂商设备保持良好的对接。此外,为保证方案的前瞻性,设备的选型应充分考虑对已有的云计算相关标准(如EVB/802.IQbg等)的扩展支持能力,保证良好的先进性,以适应未来的技术发
6、展。业务高可用云计算平台作为承载未来数据中心应用的重要11基础设施,承担着稳定运行和业务创新的重任。伴随着数据与业务的集中,云计算平台的建设及运维给信息部门带来了巨大的压力,因此平台的建设从基础资源池(计算、存储、网络)、虚拟化平台、云平台等多个层面充分考虑业务的高可用,基础单元出现故障后业务应用能够迅速进行切换与迁移,用户无感知,保证业务的连续性。统一管理与自动化云计算的最终目标是要实现系统的按需运营,多种服务的开通,而这依赖于对计算、存储、网络资源的调度和分配,同时提供用户管理、组织管理、工作流管理、自助Portal界面等。从用户资源的申请、审批到分配部署的智能化。管理系统不仅要实现对传统
7、的物理资源和新的虚拟资源进行管理,还要从全局而非割裂地管理资源,因此统一管理与自动化将成为必然趋势。1.3.2 建设思路规模建设陆续扩容对于云平台中的服务器、存储资源池构建,本次方案采用在现有硬件基础上建设的思路,重点倾向于虚拟化平台、云平台的建设。逐步通过现有服务器上业务应用的P2V迁移,对整合设备到资源池中,保证最佳的TCO(总体拥有成本)。以基础设施即服务(IaaS)为基础,逐步完善PaaS和SaaS建设云计算IaaS,通常是基于虚拟化技术(特别是硬件级虚拟化技术)实现了物理资源和应用系统的松耦合,从而体现物理资源池的理念。然而基于虚拟化技术仅仅是形成一个资源池,为了给上层应用系统提供弹
8、性的按需分配的物理资源,对于这个资源池我们仍需要进行统一的调度与管理,从而为这个资源池赋予更多的智能以满足业务的需求。近两年来,IaaS一直国内云计算服务发展的基础,该服务模式与上层应用耦合度最低,部署相对自由、灵活,相应的解决方案产品比较成熟,无需针对业务进行复杂的二次定制开发,部署和运维成本都较低,而且IaaS的部署对最终用户来说是透明的,不改变最终用户的使用习惯。本次方案的建设中,考虑到云计算数据中心建设的实际情况,我们建议初期以提供IaaS服务为基础,包括虚拟主机、虚拟存储、等服务,保证对现有应用系统和用户影响最低的前提下,逐步完成向应用向云中的迁移。对于PaaS和SaaS的建设,待I
9、aaS平台日益完善,数据格式、中间件、数据库形成标准、统一之后再逐步进行建设。第2章云数据中心解决方案2.1 云数据中心框架设计2.1.1 云数据中心总体设计云平台建设是校园云数据中心核心的建设内容,目前IT基础架构架构的发展处在虚拟化整合和云架构阶段。针对本项目的业务需求,采用虚拟化技术可以无缝的部署在信息中心的IT系统中,且满足平滑迁移、提高应用系统的可用性等业务要求,并通过云平台技术实现自动化特性。从技术上来看,虚拟化技术已经经过5-6年的快速发展,并被包括学校、电力、金融、政府信息中心等大量国内外领域使用验证,有很高的成熟度、可靠性。自助眼络门户本业”工作流联空管堰与报表虚拟化管一虚拟
10、化菅碑层虚拟化内核博根机/1名底薪庶像文仁管理计算HAr猊冽虚拟化内核虚拟计B版拟存储再KI网站覆飒资源池筑源池硬件基础设施层计翼存储欧笫2.1.2 云平台总体架构本次项目主要从基础架构整合、应用整合等方面,对甘肃中医院大学IT系统规划,从业务逻辑方面分析,可以分为云计算运维中心、虚拟网络资源池、计算资源池、存储资源池等几大部分,其逻辑关系用下表表示:云应用教将应用系统教学应用系统安全管理平台乍2胃3TS3产人小器gft砂陋菖思&(不叁在也要出出现出JHBC云平台8计目资雌网编刷ft行旭的19存停令*itSFfi附珞变温存吟派整体规划如下:基础平台整合基础平台的整合通常包括服务器资源整合。服务
11、器整合的通常表现就是采用虚拟化技术,将一套性能较强的系统,逻辑的分割为多个相对独立的系统,这样可以将较多的应用整合到较少的物理服务器里面。应用系统整合应用系统的整合主要包括应用部署进行重新规划和数据库整合二个方面。应用系统部署重新规划,主要是结合服务器虚拟化技术,将多个业务系统进行集中,同时根据业务系统类型,进行合理的资源分配。物理拓扑架构规划:建设内容:1、数据中心基础网络建设:数据中心建设面临的大量的服务器接入、通常在数据中心前端部署数据中心交换机、满足高密服务器接入需求,本次网络数据中心前端部署二台万兆数据中心交换机,满足服务器的高密接入。2、服务器池化建设:采用刀片服务器融合架构,提供
12、统一的机框、电源、风扇、交换单元,较好的扩容性能满足了数据中心资源池的需求。3、存储池化建设:部署数据中心统一存储,通过FCSAN方式实现高性能数据存储中心。4、虚拟化软件:本次方案建设采用虚拟化云数据中心建设模式、云计算核心的建设内容即为虚拟化、推荐采用*CAS虚拟化软件,对服务器进行虚拟化,通过虚拟化,一台物理服务器虚拟出多个虚拟服务器,不同的服务器满足不同的业务建设需求,实现数据中心高可靠性,高可用性特性。本方案在多个层面考虑系统冗余,保证系统高可用。具体包括:- 系统层高可用虚拟机高可用- 借助虚拟化,应用系统可以不进行任何改变即实现HA中间件层高可用- 应用服务器采用集群方式构建;-
13、 数据库服务器建立双机H;应用高可用- 针对高可用进行设计,确保集群可以正常运作;针对此次项目,管理软件将运行在虚拟机之上,采用虚机HA及应用集群方式保证双重的高可用性。针对用户虚机,管理软件将自动监测所有虚机的状态,当物理机发生故障时,管理软件将自动切换该虚机至其他物理机,确保用户虚机的可用性。2.2计算资源池设计服务器是云计算平台的核心之一,其承担着云计算平台的“计算”功能。对于云计算平台上的服务器,通常都是将相同或者相似类型的服务器组合在一起,作为资源分配的母体,即所谓的服务器资源池。在这个服务器资源池上,再通过安装虚拟化软件,使得其计算资源能以一种虚拟服务器的方式被不同的应用使用。这里
14、所提到的虚拟服务器,是一种逻辑概念。对不同处理器架构的服务器以及不同的虚拟化平台软件,其实现的具体方式不同。在x86系列的芯片上,其主要是以常规意义上的VMWare虚拟机或者*loUd虚拟机的形式存在。后续的方案描述中,都以*虚拟化软件进行描述。 CVK:CloudVirtualizationKernel,虚拟化内核平台运行在基础设施层和上层操作系统之间的“元”操作系统,用于协调上层操作系统对底层硬件资源的访问,减轻软件对硬件设备以及驱动的依赖性,同时对虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、性能优化等问题进行加固处理。 CVM:CloudVirtualizationMan
15、ager,虚拟化管理系统主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化,形成虚拟资源池,对上层应用提供自动化服务。其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可靠性(HAK动态资源调度(DRS、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机策略等。采用购置的虚拟化软件对多台PC服务器虚拟化后,连接到共享存储,构建成虚拟化资源池,通过网络按需为用户提供计算资源服务。同一个资源池内的虚拟机可以共享资源池内物理服务器的CPU内存、存储、网络等资源,并可在资源池内的物理服务器上动态漂移,实现资源动态调配。计算资源池逻辑组网架构图如下所示:H3CCVMHHr4G绿件率彼然夕
16、*ENfr片冷N件4限HMT4或H3CCVK机架服务幽刀片服多8S计算资源池逻辑组网架构建成后的虚拟化系统,虚拟机之间安全隔离;虚拟机可以实现物理机的全部功能;兼容主要服务器厂商的主流X86服务器、主流存储阵列产品、运行在X86服务器上的主流操作系统,并支持主流应用软件的运行。2.2.1虚拟机的定义虚拟机与物理服务器类似,它们主要的区别在于虚拟机并不是由电子元器件件组成的,而是由一组文件构成的。每台虚拟机都是一个完整的系统,它具有CPU内存、网络设备、存储设备和BIOS,因此操作系统和应用程序在虚拟机中的运行方式与它们在物理服务器上的运行方式没有任何区别。与物理服务器相比,虚拟机具有如下优势:
17、1 .在标准的x86物理服务器上运行。2 .可访问物理服务器的所有资源(如CPU、内存、磁盘、网络设备和外围设备),任何应用程序都可以在虚拟机中运行。3 .默认情况,虚拟机之间完全隔离,从而实现安全的数据处理、网络连接和数据存储。4 .可与其它虚拟机共存于同一台物理服务器,从而达到充分利用硬件资源的目的。5 .虚拟机镜像文件与应用程序都封装于文件之中,通过简单的文件复制便可实现虚拟机的部署、备份以及还原。6 .具有可移动的灵巧特点,可以便捷地将整个虚拟机系统(包括虚拟硬件、操作系统和配置好的应用程序)在不同的物理服务器之间进行迁移,甚至还可以在虚拟机正在运行的情况下进行迁移。7 .可将分布式资
18、源管理与高可用性结合到一起,从而为应用程序提供比静态物理基础架构更高的服务优先级别。可作为即插即用的虚拟工具(包含整套虚拟硬件、操作系统和配置好的应用程序)进行构建和分发,从而实现快速部署。2.2.2 虚拟化技术选择X86服务器虚拟化技术是在一个物理服务器上独立并行运行具有不同操作系统的虚拟机,而每个虚拟机都拥有一套独立的虚拟硬件(如CPU内存、网卡、磁盘等)。其原理是把PC服务器资源转化成逻辑计算资源,通过对物理计算资源的逻辑划分,使应用系统安全、高效、隔离的运行,提高资源利用率。放用程序(App)客户操作系统放用程序(App)客户操作系统(GuestOS应用程序卜_一一-虚拟硬件虚拟硬件虚
19、拟硬件虚拟机(VM)虚拟机管理器(VMM)硬件(CPU、内存、硬盘等)服务器虚拟化架构虚拟化对传统的物理服务器而言,在以下三个方面突破了传统的应用模式:1)它是一个抽象层,它将物理硬件和操作系统分离,从而提供更高的IT资源利用率和灵活性。2)虚拟化允许具有不同操作系统的多个虚拟机在同一实体机上独立并行运行。每个虚拟机都有自己的一套虚拟硬件,可以在这些虚拟硬件上加载操作系统和应用程序。无论实际采用了什么物理硬件组件,操作系统都将它们视为一组标准化的硬件。3)虚拟机被封装在文件中,因此可以快速对其进行保存、复制和部署。可在几秒钟内将整个系统(完全配置的应用程序、操作系统、BlOS和虚拟硬件)从一台
20、物理服务器迁移至另一台物理服务器,以实现零停机维护和连续的工作负载整合。由于虚拟架构使操作系统摆脱了和底层硬件驱动之间的紧耦合关系,操作系统和上层应用可在计算资源池内平滑迁移,为应用系统提供具有高性能计算能力、安全稳定、灵活的硬件承载平台。X86服务器虚拟化体系结构主流的有两种:寄居架构和裸金属架构,其架构如下图所示:寄居架构棵金属架构计算虚拟化技术分类寄居架构就是在操作系统之上安装和运行虚拟化程序,依赖于主机操作系统对设备的支持和物理资源的管理。因为虚拟化软件运行在主机操作系统之上,因此效率低、可靠性不高,主要应用于桌面级应用。裸金属架构是直接在硬件上面安装虚拟化软件,再在其上安装虚拟机的操
21、作系统和应用。虚拟化软件本身就是一个微内核,因为直接运行在主机硬件之上,效率高、可靠性高。本项目建议选用裸金属架构,同时,借助硬件辅助虚拟化,可以充分发挥服务器CPU内存、IO性能,虚拟化管理平台的服务器性能消耗不超过1%2.2.3 计算资源池分类为了提升虚拟化系统的可靠性,在虚拟化平台的计算资源池建设时,可以将多个物理主机合并为一个具有共享资源池的集群。虚拟化软件管理系统的HA功能组件会监控该集群下所有的主机和物理主机内运行的虚拟机。当物理主机发生故障,出现宕机时,HA功能组件会立即响应并在集群内另一台主机上重启该物理主机内运行的虚拟机。当某一虚拟服务器发生故障时,HA功能也会自动的将该虚拟
22、机重新启动来恢复中断的业务。在搭建服务器资源池之前,首先应该确定资源池的数量和种类,并对服务器进行归类。归类的标准通常是根据服务器的CPU类型、型号、配置、物理位置来决定。对云计算平台而言,属于同一个资源池的服务器,通常就会将其视为一组可互相替代的资源。所以,一般都是将相同处理器、相近型号系列并且配置与物理位置接近的服务器一一比如相近型号、物理距离不远的机架式服务器或者刀片服务器。在做资源池规划的时候,也需要考虑其规模和功用。如果单个资源池的规模越大,可以给云计算平台提供更大的灵活性和容错性:更多的应用可以部署在上面,并且单个物理服务器的宕机对整个资源池的影响会更小些。但是同时,太大的规模也会
23、给出口网络吞吐带来更大的压力,各个不同应用之间的干扰也会更大。如果有条件的话,通常推荐先审视一下自身的业务应用。可以考虑将应用分级,将某些级别高的应用尽可能地放在某些独立而规模较小的资源池内,辅以较高级别的存储设备,并配备高级别的运维值守。而那些级别比较低的应用,则可以被放在那些规模较大的公用资源池(群)中。初期的资源池规划应该涵盖所有可能被纳管到云计算平台的所有服务器资源,包括那些为搭建云计算平台新购置的服务器、内部那些目前闲置着的服务器以及那些现有的并正在运行着业务应用的服务器。在云计算平台搭建的初期,那些目前正在为业务系统服务的服务器并不会直接被纳入云计算平台的管辖。但是随着云计算平台的
24、上线和业务系统的逐渐迁移,这些服务器也将逐渐地被并入云计算平台的资源池中。对于X86系列的服务器,除了用于生产系统的资源池以外,还需要专门搭建一个测试用资源池,以便云计算平台项目实施过程以及平台上线以后运维过程中使用。在云计算平台搭建完毕以后,服务器资源池可以如下图所示:2.2.4 服务器容量规划单台服务器所能支持虚机数量的决定因素主要取决与两方面:1 .服务器的硬件配置CPU性能-多核高主频技术使得(Hl成为性能瓶颈的可能性越来越低内存大小-一做为硬指标的内存,配置越高,所能支持的虚机数量越多网络端口-一千兆网环境已很普遍,网络带宽大多有保证,更多从管理角度来考虑侬卡-磁盘访问性能对虚机数量
25、有一定影响,建议采用IOG以太网或者8GbpsFC以减少链路影响本地磁盘-内置磁盘的可用性及IO吞吐能力均较弱,不建议在其上存放虚拟机,推荐使用外置高性能磁盘阵列2 .应用负载大小由于物理服务器资源自身的最大限制,应用负载越大,所能同时运行的虚机数量越少建议将不同应用访问特性的应用混合部署在同一物理服务器上灵活运用DRS和VMotion技术可将物理机与虚机的比率关系调到最优考虑到HA及DRS所要求的资源冗余,所有运行虚机在正常负载下,总体资源使用率不超过三分之二会比较合适在部署虚拟化时,对物理服务器的硬件配置需要考虑以下因素:可用的CPU目标数量尽可能多,单台服务器建议配置6个以上的CPU核。
26、超线程技术并不能提供等同于多核处理器的好处;建议关闭CPU的超线程功能使用具有EM64T能力的IntelVT或AMDV技术的CPU可以同时支持运行32位和64位的虚拟机采用同一厂商、同一产品家族和同一代处理器的服务器组成的集群,可以获得最好的虚拟机迁移兼容能力内存资源往往比CPU资源更会成为潜在的瓶颈,尽可能采用最大容量的内存条(单条8G瞅果优于两条4GDo2.2.5 虚拟机资源分配1 .虚拟机CPU分配原则:尽量使用最少的vCPUs,如果是单线程应用,无需多线程处理。虚拟CPU数量不要等于或超过物理CpC核数,如双路双核的服务器配置,虚机最多使用两个虚拟CPU2 .内存分配原则:内存总量为在
27、资源评估后,计算虚拟机评估结果所需实际内存尽量避免大于物理内存的总和。因为应用程序而产生的更多内存需要用磁盘内存来解决,会导致系统性能下降。关键应用可考虑固定内存的方法以保证性能的稳定性2.2.6 虚拟机的物理分布同一个资源池内的虚拟机在物理服务器上的分布,要尽可能考虑平衡负载的原则,即保证资源池内的物理服务器CPU内存资源占用率均衡,避免某单台物理服务器上的负载特别高,而其它处于闲置状态。个别业务应用可能会存在某个时段负载突发上升的情况,如公务员报考系统,对于这类应用,需要部署DRS动态资源调度)和DRX(动态资源扩展):通过动态资源调度(DR9集群的部署,可以解决单个虚拟机负载过高时,位于
28、同一台物理服务器上的其它业务应用虚拟机不会被“饿死”。通过动态资源扩展(DRX详细方案描述见2.2.9)集群的部署,可以解决当单个虚拟机负载超过物理服务器性能后,快速克隆多个同样业务的虚拟机,配合负载均衡(LB)设备,完成对负载的分担。2.2.7 虚拟机模板设计业务应用模板是由虚拟机配置定义、操作系统、基础应用三部分组成。1 .虚拟机配置定义:包括虚拟机的vCPU内存、网络策略、虚拟存储vDisk等参数的定义。2 .操作系统:包括WindowsServer、Linux等支撑上层业务应用的操作系统,以及操作系统配套的相应补丁及病毒。同时可以根据应用模板的类型,开起相应的系统服务(如IIS、IHP
29、等)。3 .基础应用:包括中间件、WEB服务端等基本应用,根据应用模板的类型,决定模板需要安装的基础应用。业务应用模板的设计是云平台业务快速部署的基础,通过虚拟机模板快速部署虚拟机,可以大幅节省安装操作系统、病毒与补丁、系统服务、中间件的时间,由相应模板部署的虚拟机就相当于是一台安装好操作系统、病毒库、基础应用的服务器,只需安装相应的.业务应用软件即可让业务快速上线。在采用云计算来向用户交付服务时,用户通过云门户自助申请的IT服务资源就是业务应用模板,因此需要提前设计好相应的IT服务模板向云门户发布,当用户申请该服务时,云平台根据模板进行资源编排,快速生成虚拟机相关资源交付给用户使用。模板的设
30、计一定要具有通用性,避免设计大而全的模板,这样的模板在部署为一个虚拟机之后,没有通用性将再也没有人使用。2.2.8高可用性设计高可用性包括两个方面:L虚拟机之间的隔离:每个虚拟机之间可以做到隔离保护,其中一个虚拟机发生故障不会影响同一个物理机上的其他虚拟机:2.物理机发生故障不会影响应用:故隙物理机上运行的虚拟机可被自动迁移接管,即虚拟机可以在同一集群内的多台服务器之间进行迁移,从而实现多台物理服务器的之间的相互热备,实现当其中一个物理服务器发生故隙时,自动将其上面的虚拟机切换到其他的服务器,应用在物理机宕机情况下保证零停机。虚拟机的迁移需要依赖共享存储,关于共享存储,后续章节将详细介绍。*C
31、AS虚拟化平台HA功能会监控该集群下所有的主机和物理主机内运行的虚拟主机。当物理主机发生故障,出现宕机时,IlA功能组件会立即响应并在集群内另一台主机上重启该物理主机内运行的虚拟机。当某一虚拟服务器发生故障时,HA功能也会自动的将该虚拟机重新启动来恢复中断的业务。除了对集群中的物理服务器节点进行持续检测之外,*CASHA软件模块还对运行于物理服务器节点之上的虚拟机进行持续检测。在每台服务器节点上都运行了一个LRMd(LoCaIResourceManagerdaemon,本地资源管理器守护进程),它是HA软件模块中直接操作所管理的各种资源的一个子模块,负责对本地的虚拟化资源进行状态检测,并通过S
32、helI脚本调用方式实现对资源的各种操作。当LRMd守护进程检测到本机的某台虚拟机出现通信故障时,首先将事件通知给DC,由DC统一将该虚拟机状态告知集群内所有的物理服务器节点,并按照一定的策略算法,为该故障的虚拟机选择一个空闲的服务器节点,在该节点上重启该虚拟机。使用虚拟化软件HA特性进行虚拟机故障切换2.2.9动态资源扩展(DRX政务业务访问量的突发性变化和对应的政府信息中心IT资源的供给是一对矛盾体。对于信息中心IT管理人员来讲,一个很重要的任务就是在这两者之间达到一个相对的平衡。云计算技术的出现和部署可以使政府信息中心IT资源以更小粒度使用和交付,同时显著的增强了政府信息中心IT资源使用
33、效率和调度的灵活性、敏捷性。从而使得上述平衡可以更加容易获得。但由于各IT管理系统的割裂,导致上述过程并无法有机的自动完成。因此迫切需要一个新的解决方案通过整合和自动化部署来实现IT资源供给和业务需求的动态平衡。云计算带来的新变化与新需求部分政府信息中心业务的访问量会周期性或随机的出现波动。有些业务的波动幅度很大,其峰值访问量甚至会超出正常访问量的好几倍(典型的如:公务员报考期间对报考系统的访问量会极大的超过非报考期间的访问量)。随着访问量的弹性变化,这类业务对IT资源的需求也存在较大的波动,这就要求政府信息中心IT基础架构能够支撑样的弹性扩展需求,IT部门面临很大的挑战。为了应对这样的IT需
34、求,通常有以下两种部署方式。静态部署:IT部门按照业务峰值应用的IT需求来规划部署对应的IT资源,这些IT资源(主要是服务器)专机专用,服务器部署好以后保持长期稳定运行状态,无论当前业务负载量大小是否发生变化,均由这些服务器对外提供业务。动态扩展:IT部门动态调整服务器的数量来应对业务访问量弹性变化的需求,即在业务访问量上涨前或初期,通过增加服务器来新增对业务容量。业务访问量下降时,将新增的服务器回收用于支撑其他业务。比较项动态扩展方式静态部署方式响应敏捷度响应慢。物理服务器扩展流程复杂,周期长,难以快速响应业务需求响应快。业务服务器部署完成并纳管后,无需人工干预即可响应业务访问变化需求运维复
35、杂度复杂度高。资源扩展和收缩时,均需要进行服务器和业务系统的部署复杂度低。一次部署,长期使用资源利用率资源利用率较高。业务对应的IT资源随着业务访问量的变化而弹性变化。业务需求和IT资源供给达到一定程度的平衡,资源能比较充分的利用资源利用率低。资源按最大需求部署。业务量低时,部署的资源无法得到充分利用成本相对低。资源充分利用,灵活调配高。较多的闲置资源适用场景适用于业务访问量波动有规律而且不频繁的场景适用于业务波动随机性强或波动比较频繁的场景两种部署模式比较通过上表对两种部署方式的对比可以看出,两者各有优缺点,政府信息中心IT部门可以根据本政府信息中心自身的业务特点来选择部署。通常来讲,大多政
36、府信息中心业务访问的随机性都比较强,所以传统IT环境下通常会选择静态部署方式。对政府信息中心IT部门来讲,云计算带来了全新的IT基础架构建设、使用和交付模式,其中,云计算的基础一一计算虚拟化技术尤为突出。总的来说,计算虚拟化给政府信息中心IT基础架构带来如下两个变化。更细粒度的IT资源使用和交付模式。计算虚拟化是“一虚多”的技术,即将一台物理服务器虚拟化为多台虚拟服务器,各虚拟服务器均作为独立的实体来承载政府信息中心业务。当政府信息中心业务系统承载的主体由传统的硬件服务器转变为虚拟服务器后,IT部门是在将IT资源以更细粒度的虚拟服务器交付给业务部门。政府信息中心物理服务器可以为多个业务部门所共
37、享,极大的提升了物理服务器的利用率。快速敏捷的IT基础资源交付和部署模式。在传统IT部署中,物理服务器涉及硬件产品的采购、组装、上架等流程,流程复杂且周期长;而虚拟服务器的部署则不涉及这些问题。同时,由于虚拟化的特质,虚拟服务器可以通过快速的克隆复制来实现快速的批量部署。因此,IT部门可以通过快速部署虚拟服务器的方式迅速响应政府信息中心业务系统的业务承载需求和变化。另外,虚拟服务器可以在多个硬件服务器之间灵活的迁移的特点,极大的提升了IT资源调度的灵活性。政府信息中心将其业务系统部署于虚拟服务器上对外提供服务,可以在保证各业务系统的独立性、安全性和可靠性的同时极大的提升物理服务器的利用率和资源
38、调度灵活性。正由于上述计算虚拟化技术给政府信息中心IT建设带来的诸多好处,越来越多的政府信息中心将业务部署于虚拟服务器上进行承载。计算虚拟化简化了部署业务服务器的流程和具体工作,极大的缩短了新业务服务器的部署周期,使得通过快速增减业务服务器来应对业务访问量的突发性变化成为可能。因此,部署了云业务环境的政府信息中心开始考虑采用动态部署方式来应对业务访问的突发性需求。但采用动态资源部署方式的一个不能忽略的前提是:政府信息中心IT管理人员能够对业务访问量的突发性变化具备很强的敏感性,并且能够迅速采取应对措施。但当前的11基础架构中,政府信息中心业务负载监控平台、虚拟服务器管理平台和业务分发的系统之间
39、往往是割裂的,没有整合形成统一方案。IT管理人员在感知到业务访问变化时,只能通过手工进行虚拟服务器的增减和在业务分发系统的相应配置。这无疑缺乏灵活性且效率低下。因此,政府信息中心需要一个新的解决方案,整合上述的业务负载监控平台、虚拟服务器管理平台和业务分发系统,自动化的实现上述三个业务系统的关联部署,为政府信息中心11基础架构注入智能,增强IT资源调配的自动化能力。同时构建一个统一的管理平台来实现针对支撑政府信息中心特定业务的一组虚拟服务器的运行状况进行统一的监控、管理和集中展示。针对这些需求,*推出了“面向应用的云动态资源扩展解决方案”DRX(DynamicResourceextension
40、,动态资源扩展)解决方案。面向应用的云动态资源扩展解决方案解决方案逻辑架构该方案的关键在于其实现政府信息中心业务负载和IT支撑资源供给水平的自动关联。通过感知业务系统的负载状况,并根据业务系统的实际负载状况自动联动IT基础架构进行基础资源的弹性扩展,实现了政府信息中心业务需求向IT需求的自动映射和资源调度。为了实现上述目标,解决方案应该包括如下四大功能:服务器资源虚拟化和池化,这是整体解决方案的基础:基于业务负载的资源动态调度:业务负载状况监控:多个虚拟资源之间的业务负载分发功能。这些功能分别同资源层、业务资源调度和展示层、业务负载监控模块和业务负载分发模块等功能模块对应(如下图所示)。业务资
41、源调度&展示展解决方案逻辑架构资源层负责将数据中心内的物理资源虚拟化和池化,并以虚拟服务器为单位对外提供服务。总体来讲由以下三个子模块组成。物理资源层:由数据中心内的多台物理服务器组成,为政府信息中心业务提供服务器资源,服务器规模由政府信息中心业务总体需求确定。虚拟化内核平台:安装于物理资源层内的物理服务器上,实现物理服务器的硬件资源的逻辑封装和虚拟化,是政府信息中心云计算架构的基础。虚拟资源层:物理资源层上运行的虚拟服务器的集合,共同构成统一的虚拟服务器资源池。池内的虚拟服务器作为政府信息中心业务承载的最小单元,对外提供业务服务。业务资源调度限示层业务资源动态调度模块:该模块为管理一组虚拟服
42、务器,为一个特定的用户业务(后面我们统一称为“动态资源扩展业务”)提供服务。我们把这个虚拟服务器组称为“业务动态资源扩展服务器组”。同时该模块通过与业务负载监控模块的联动,及时感知业务负载状况,根据业务实际负载变化动态的增加或减少虚拟服务器组内运行的服务器数量来实现针对同一业务的服务器资源的弹性扩展。虚拟服务器的扩展(伸缩)可以通过虚拟机的克隆创建、删除和停止等方式来实现。要注意的是,该模块需要提供北向接口,实现和业务负载监控模块以及业务负载分发模块的联动。业务资源调度展示模块:为了实现对数据中心内运行的“动态资源扩展业务”的运行状况和资源支撑情况进行直观的展示,帮助IT管理人员对“动态资源扩
43、展业务”进行有效的管理和预判。该模块提供丰富的动态资源扩展业务的统计信息展示,如TOPN的虚拟服务器CPU占用率等。业务负载监控模块该模块对支撑某一特定业务的所有虚拟服务器的负载状况进行统一监控。管理员可以根据业务情况事先设定阈值,当该组虚拟服务器的负载上升超出设定的上限阈值后,联动业务资源调度模块自动扩展该业务对应的虚拟服务器资源;反之,当该组虚拟服务器的负载下降超出设定的下限阈值后,联动业务资源调度模块自动减少该业务对应的虚拟服务器资源。业务负载分发模块该模块实现将“业务动态资源扩展服务器组”内的多个虚拟服务器整合为一个逻辑整体来共同支撑一个用户业务。这需要该模块其将对该业务的访问按照管理
44、员事先设定的策略分别发到对应的各虚拟服务器上;这个分发策略由IT管理员依据业务的特点来自行选择。如,各虚拟服务器的监控状况、负载情况、随机轮转分发等。DRX解决方案组成及特点DRx解决方案依托*CAS云计算管理平台实现(如下图所示)。CAS云计算管理平台是为政府信息中心数据中心量身定做的虚拟化和云计算管理软件,CAS平台中集成了一个基础业务负载监控模块。该模块能够监控承载特定业务虚拟服务器组的负载状况,并根据业务负载的状况联动云管理平台实现资源的动态注入和回收。业务负载监控模块业务负载分发模块业务资源调度&展示层资源层DRX解决方案架构依托CAS云管理平台,通过整合基础业务负载监控模块、业务资
45、源调度崛示模块、业务分发平台,DRX解决方案主要提供以下关键功能:用户业务的负载监控通过基础业务负载监控模块监控运行于其虚拟化平台上的虚拟服务器的实际资源负载状况;用户通过CAS平台创建资源扩展业务时,可以设定好业务负载的上下限阀值:当业务负载超出用户事先设定的阀值后,业务负载监控模块给业务资源调度模块上报资源扩展事件,以触发业务资源的弹性扩展(包括资源的动态伸缩);基于用户业务负载的动态资源扩展CAS平台上可以创建业务动态资源扩展业务,支撑该业务的所有虚拟服务器进行统一的集中管理;为了防止同一个业务无限占用云平台内的资源,I)RX解决方案将同一个业务的资源扩展范围限定在一个特定的物理资源池内
46、(包括服务器和存储资源),即后续虚拟服务器的增加和回收均在该物理资源池内进行;接收到业务负载监控模块上报的资源扩展事件后,业务资源调度模块会在限定的物理资源池内选择负载最轻的一台物理服务器上通过启动当前已经存在的虚拟服务器或者克隆创建一台新的虚拟服务器的方式,以扩展该业务的支撑资源;业务负载自动分发通过集成的*负载均衡设备可以将业务请求分发到新创建的虚拟服务器中,以实现对业务负载的分担;动态资源扩展业务信息展示CAS平台上可以提供丰富的动态资源扩展业务的各种信息展示,以便于运维人员掌握当前某特定业务的资源部署状况和各虚拟服务器的运行状况(如“业务资源Cpu使用状况”、“TOP5虚拟服务器CPU利用率”等)。*DRX解决方案整合了基础业务负载监控平台、资源调度平台、业务分发系统和展示平台,可以针对用户业务负载的变化自动的增减相应IT资源。从而较有效的实现政府信息中心业务访问量的突发性变化和对应的政府信息中心IT资源的供给的动态平衡,提升IT基础架构的有效使用率和调度灵活性。其具有以下功能特点。面向业务:基于用户业务承载状况实现业务实际所需资源的动态调度。业务资源的动态弹性扩展:支持业务资源的动态弹性伸缩,实现IT资源供给和业务需求的动态平衡。统一的资