《运维管理规范.docx》由会员分享,可在线阅读,更多相关《运维管理规范.docx(23页珍藏版)》请在课桌文档上搜索。
1、系统运维培训手册版权归属密级内部公开作者版本V1.0状态草稿0时间2023.09.21公布文献标识无修订修改内容IT系统运维流程和详细环节日期:2023年09月21日一、导言51.1 目051.2 范围51.3 版本信息51.4 系统概述5二、系统运维体系框架62.1 运维团体人员划分62.2 岗位人员分派7三、基础建设管理83.1 系统架构83.2 服务器资产管理83.3 信息记录管理113.3.1 信息资产记录.113.3.2 帐号密码管理.Jl四、布署124.1 存储设备124.2 数据库布署134.3 操作系统144.4 企业软件14五、监控145.1 基础监控145.2 docker
2、监控155.3 听云监控15六、故障与排障166.1 故障等级166.2 报障流程176.3 排障流程17突发事件应急方略.176.3.2行为规范.18七、升级187.1硬件升级187.1 J硬件升级规范.187.2 软件升级19软件采购申请规定.19软件验收.20软件使用.错误!未定义书签。八、经费管理218.1 新增项目流程218.2 新增人员流程21一、导言1.1 目的该文档的目的是描述彩生活TT系统顾客使用阐明,其重要内容包括: 运行环境 安装与配置 操作阐明本文档的预期的读者是: 运行人员、测试人员、研发人员等1.2 范围该文档定义了系统提交产品的使用阐明,重要描述了产品的操作流程,
3、以及配置阐明。1.3 版本信息下表展示【系统运维培训手册】版本更新记录修改编号修改日期修改后版本修改内容012023.09.21V1.0基础框架阐明1.4 系统概述系统运维培训手册意在服务于彩生活IT运维部门,有效管理IT系统、满足集团IT设备管控需求,提高集团IT运维智能化。二、系统运维体系框架2.1运维团体人员划分岗位名称岗位职责产品经理拟订部门阶段工作计划,协调部门内部工作,实行部门员工管理与业绩考核,提出部门员工配置与奖罚意见,指导并督促部门员工工作,保证正常工作进度。根据工作量合理安排部门人员分工,并进行督促指导、检查与考核。协调运维工作中企业与业主之间的良好关系,提高服务满意度。加
4、强工作质量的管理力度,组织人员对负责路线进行事前控制和实时检查,对检查中发现的问题及时采用措施。协调处理系统运行中出现H勺系统、技术问题,采用有效负责处理措施,防止不良事故的发生。定期组织部门人员进行培训、会议及学习,提高业务水平。完毕企业领导交办的其他工作任务。系统工程师1 .负责服务器H勺搭建、维护等工作。2 .各项服务器H勺平常管理、维护、保养、检查及日志的监控与分析。3 .负责集团各项应用系统运行布署、网络设备调试、服务器管理等工作。4 .负责各类应用系统的故障分析及错误排除。5 .负责集团信息化硬件项目建设,包括需求调研、产品选型、实行、培训和技术支持工作。网络工程师1 .负责中心机
5、房网络设备、环境、运作状况的维护、保养、检查;视频、会议系统管理与维护。2 .视频监控系统管理与维护。3 .防火墙、路由器、数据互换机、光端机、UPS的状态监控,以及性能优化,配置修改,保证外网对企业官网的访问以及企业内部网络的正常;维护企业VPN线路,保证邮件等系统的正常访问;Sdh专线、光连路日勺监控、测试、故障申报与处理。4 .企业Internet域名、二级邮件域名、DNS指向等互联网业务申请、分理和维护。5 .负责集团网络工程的规划、督导、项目实行及技术支持。技术支持1 .负责协助部门领导完毕IT有关项目计划和实行。2 .负责项目实行过程中岗位培训、应用指导、项目平常管理。3 .负责跟
6、踪项目进度,协调各部门组员之间的合作。4 .及时向项目主管汇报项目的进展状况和实行、应用过程中出现H勺问题。5 .客观公正地对项目组员、操作人员H勺工作进行组织、监督和管理。6 .项目总结以及项目文档H勺编写,为项目提供有针对性的处理方窠,并采用多种实际措施,推进处理方案的贯彻。7 .协助当地网络、有关办公设备维护及视频、会议开通。8 .完毕部门领导安排的其他工作。运维客服L邮件、RTX.OA等信息化系统技术支持工作。2 .记录集团内部申报的IT故障,并转交有关负责人进行处理,对故障处理成果进行跟踪及反馈。3 .负责邮件、RTX、OA应用系统后台维护管理工作,根据各单位需要进行办公系统H勺开通
7、、撤销、组织架构调整等有关工作,并实时进行记录。4 .对邮件密保使用状况进行管理,对涉密人员进行密保绑定及特殊状况的处理,保障邮件系统安全运行。2.2岗位人员分派M:ir7现缰 动 化 I H“电 I r*63三、基础建设管理3.1 系统架构称动ES用WebSSffiOHTTPtHTTPS, MQrrrAMQ消息中心3.2 服务器资产管理3.2.1 服务器资产定义1.服务器资产资产重要包括员工正常应用所配置的服务器及配套软件,为服务器环境所购置的网络设备、配件,包括资产性支出固定资产部分及费用支出非固定资产部分。3.2.2 服务器资产分类资产类别类别细分说明主管部门硬件类终端设备主机、显示屏、
8、研究院网络设备路由器、互换机、防火墙、HUB、机柜等研究院服务器邮件、DM服务器,应用系统服务器等研究院耗材类配件硬盘、内存、网卡、显卡,主板、CPU等研究院耗材键盘、鼠标、U盘、光驱、网线、电源线、插线板等研究院软件类终端使用操作系统、办公软件、辅助软件、云服务器及对应部专用软件研究院服务器使用操作系统软件与服务器应用软件等研究院综合使用网络管理软件与财务应用软件答办公辅助软件研究院3.2.3 硬件类资产管理IT资产硬件类属于资产性支出的固定资产部分。在IT资产硬件类管理过程中,不同样阶段会出现资产的入库验收、管理、使用申请、借用、转移、报废等操作。以上所有操作都必须严格遵守有关操作规程方可
9、执行。1.硬件类入库验收规定硬件类入库验收是指运维部门接受到采购申请单采购的服务器等IT硬件类资产后,办理资产入库前对有关资产进行的资产清点、外观检查等查点和核算及I过程。在资产入库验收时如发现所验货品与装箱单等不符或设备外形出现严重变形,主管部门负责人有责任将验收成果反馈给采购部门,由采购部门负责处理退货或更换等事宜。主管部门在获得有关IT资产并验收完之后使用之前依其类别和科目予以分类粘贴资产编号标签。所有通过验收后入库的)资产均由运维部门负责保管,如出现由于保管不利而导致的资产遗失、人为损坏等状况,运维部门将承担重要责任。运维部门在办理完入库验收工作后,必须对所有入库资产进行登记,填写验收
10、、使用、更换、报废登记表。2 .硬件类资产使用申请规定根据业务需要,在Oa上填写资产申请表申请。3 .硬件类资产的借用规定除主管部门外,任何人都无权出借硬件类资产或安排出借硬件类资产事宜。主管部门日勺硬件类资产登记台帐应反应出借用部分,保证使用权和其他权限的清晰明确。4 .闲置硬件类资产的回收与发放规定闲置类硬件资产回收后,主管部门将根据评估其性能等,并记录闲置类资产台帐中,根据后来的需求状况进行再次发放和调控,投入再使用。5 .硬件类资产报废规范本制度规定办公IT硬件资产的报废采用两种方式,即积极报废方式和被动报废方式。被动报废方式是指当硬件类资产受到严重损伤且简朴维修无法恢复使用时,其价值
11、明显减少的状况下应提交申请报废。此外这种报废还包括已经满折旧年限且无法维持正常工作的硬件类资产部分。被动报废方式是一般意义上的报废方式,有关报废规定如下:1)主管部门按照规定提交有关报废申请,由财务部安排报废,并由财务作对应的会计处理。2)报废的发起人为主管部门,员工无权申请报废。3)报废时主管部门必须填写报废申请单,同步在报废登记表中进行登记,反应已经报废的那部分资产。4)报废的编号不重新使用。积极报废方式是指硬件类资产由于使用时间日勺增长,作为办公平台所能提供的性能、效率、可靠性和稳定等已经很难满足事务所办公的最低端业务的需要时,由主管部门根据资产自身Fl勺性能指标分析并结合受益人的意见,
12、提请对硬件类资产的报废。积极报废方式是从办公效率和新业务需求等角度去积极地做合适时淘汰。重要操作规范参照被动报废方式的有关规范。3.3信息记录管理3.3.1 信息资产记录(一)硬件设备型号、数量、版本等信息记录记录(二)软件产品型号、版本和补丁等信息记录记录(三)网络构造、网络路由、网络IP地址记录记录(四)综合布线系统构造图的绘制(五)其他附属设备的记录记录3.3.2 帐号密码管理(一)服务器和数据库的管理账号密码,由系统管理员和数据库管理员设定并持有,实行定期修改制度,最长有效期不超过90天。(二)更换服务器与数据库密码时必须报行政封存,以防遗失密码。如发现密码及口令有泄密迹象,管理员要立
13、即汇报主管领导,严查泄露源头,同步更换密码。(三)密码需要按照如下规则设定,即由大写字母,小写字母,数字,和字符构成;最低位数为10位;不能与以往的密码反复。(四)提议借助密码生成器按照密码设定规则,生成密码。四、布署4.1基本原则运用虚拟容器技术的“一次装载到处布署”的特性,实现统特性的服务节点规模布署,而节点间彼此独立。4.1存储设备例如raid磁盘阵列,san存储系统、磁盘阵列、等存储设备。存储设备布署,重要由系统运维工程师负责。基本环节如下1 .现场备件安装配合厂商(供应商)进行现场备件安装。2 .补丁服务消除软件漏洞给系统带来口勺安全隐患,并对安装补丁所引起口勺系统连锁反应进行合理的
14、平衡。3 .升级服务对系统进行软件或硬件的升级,以改善、完善既有系统或消除既有系统的漏洞。4 .问题管理系统对碰到的问题进行汇总和公布。形成技术文档。5 .系统优化监控管理对设备进行系统H勺优化监控,对存储互换机设备状态、端口状态、传播速度监控、对监控备份服务进程、备份状况(起止时间、与否成功、出错告警)监控、对监控记录磁盘阵列、磁带库等存储硬件故障提醒和告警等监控,对存储的性能(如高速缓存、光纤通道等)进行监控。并及时处理故障问题、4.2数据库布署1 .数据库选型对系统的配置及运作框架提出提议,以协助您得到一种更坚强可靠的运作环境,减少系统潜在的风险,包括数据丢失、安全漏洞、系统瓦解、性能减
15、少及资源紧张2 .数据库软件安装。进行数据库环境布署,数据库空间的规划管理,设定自动备份机制等。完毕布署文档。3 .检查数据库系统与否需要应用最新H勺补丁集进行数据库补丁升级,完毕服务器运行文档。4 .数据库系统优化分析顾客的应用类型和顾客行为、监控数据库性能、评价并修改数据库的参数设置、评价并调整数据库的数据分布、评价应用对硬件和系统的使用状况,并提出提议。提供完整的性能调整汇报和处理措施4.3操作系统1.操作系统选型根据应用Ifi运行环境,进行最优的系统选型。2 .布署操作系统,并连通网络。完毕布署文档3 .检查操作系统与否需要应用最新的补丁集,4 .登记操作登记表4.4企业软件五、监控5
16、.1基础监控从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维监控。1 .设备基础性能检测:cpu、内存使用状况监测;2 .设备日志查看:3 .设备SnmP状态;4 .测试Ping,tracert等工具的连通性;5 .网络安全方略应用与否正常;6 .Internet带宽流量的实时监测;7 .网络拓扑链路状态监测;8 .异常网络数据包流量;9 .Dos、ddos等网络袭击状况监测;10 .Internet线路H勺误码率、丢包率监测;5.2 docker监控5.3 听云监控听云SerVer是服务端应用性能处理方案。通过在服务端应用中植入探针,可以对应用代码、关系型数据库、NoS
17、QL外部服务、服务器进行监控,协助顾客即时获取有关性能数据并进行智能分析,在代码层面上定位错误发生、性能下降的原因。听云运行架构图真实用户视角IficApp回程股用户视角QIficNetwofk听云监控流程1 .向研究院领导提出申请需将应用布署上听云监测问题的专业企业,首先需向研究院领导提出申请,申请之前请准备好应用项目的有关信息,包括:应用名称、开发语言、布署的机房名称或者服务器资产托管供应商、布署服务器、服务器有关配置、申请使用时间(期限)、应用类型等信息,形成.txt文档上传到附件。(使用case:42645)记录2 .领导审批研究院领导会根据专业企业提供的应用项目信息进行审核。3 .贯
18、彻三布署工作假如领导审批同意布署将进入布署工作。4 .登录应用,使用应用、产生数据。5 .测试成功产生数据后反馈给项目。6 .运维人员监看数据变化,出汇报,协助处理问题。六、故障与排障6.1 故障等级故障级别响应时间故障处理时间I级:属于紧急问题;其详细现象为:系统瓦解导致业务停止、数据丢失。IO分钟,30分钟内提交故障处理方案3小时以内II级:属于严重问题;其详细现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。IO分钟,30分钟内提交故障处理方案6小时以内级:属于较严重问题:其详细现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。IO分钟,30分钟内提交
19、故障处理方案12小时以内IV级:属于一般问题;其详细现象为:系统技术功能、安装或配置征询,或其他显然不影响业务的预约服务。IO分钟,2小时内提交故障处理方案24小时以内6.2 报障流程报障基本流程事故报告6.3 排障流程突发事件应急方略1、值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、精确鉴定故障发生的数据域,负责跟踪该事件直至其结束。对于不在运维中心的故障,应在第一时间内告知负责人去现场处理,亲密关注事件流程及进展状况,并做好登记工作上报领导。2、正常状况下,规定值班人员在10分钟内进行事件确认。假如属于一般事件则按照事件流程进行分派处理,否则应迅速启动应急预案,并严格按照应
20、急预案所规定R勺环节迅速实行应急处置,及时汇报上级领导,掌握实时处理状况。3、在处理过程中,如需其他部门去现场支援处理,应及时向上级领导部门汇报,协调沟通,尽快联络技术工程师或厂家技术支持赶赴现场援助处理。6.3.2行为规范1、遵守顾客U勺各项规章制度,严格按照顾客对应日勺规章制度办事。2、与顾客运行维护体系其他部门和环节协同工作,亲密配合,共同开展技术支持工作。3、出现疑难技术、业务问题和重大紧急状况时,及时向负责人汇报。4、现场技术支持时要精神饱满,接听时要文明礼貌,语言清晰明了,语气和蔼。5、遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的I密码、关键参数、业务数据等负有保
21、密责任,不得随意复制和传播。七、升级7.1 硬件升级7.1.1 硬件升级规范硬件类资产的改造升级可分为两种:积极升级和被动升级。被动升级规定:适应于波及面和代价较小的改造升级部分1)当硬件类资产原有的配置经主管部门确定确实不能满足既有的需求,但仅作少许投入就可以抵达需求原则时,则受益人可以申请对有关的硬件类资产进行改造升级。2)在进行硬件类资产改造升级过程中,增强其能力和延长其使用年限的部分应计入该硬件类资产的价值中。对于替代式升级则应计算其差价部分,如做增长式升级则直接计算增长部分FI勺价值。如仅做维修以维持使用效果的费用应计为一般性费用支出。积极升级规范:从企业服务器资产管理的整体角度出发,全面调整和配置企业服务器资产,抵达改造升级和节省在投入的目的.1)在积极升级过程中,运维部门的职责是提出积极改造升级的可行性方案,并提交有关申请,经必要的审批和确认后执行。7.2 软件升级软件采购申请规定软件采购申请由运维部门需求汇总后,统提交采购申请审批流程。软件验收软件到货后,由运维部门进行验收,并做好验收记录,验收完毕后由主管部门做好软件库存管理登记。软件使用统一由运维部门人员进入安排安装,维护。八、经费管理8.1新增项目流程I是