关于我们 新闻资讯 解决方案
加入收藏 设为首页 企业邮箱
产品中心 案例展示 联系我们
 

解决方案 您的位置:首页 > 解决方案 > 解决方案 >

运行服务应急方案
2021-07-05 09:35:33   来源:   

紧急故障应急措施应以快速恢复客户使用为目标,第一时间将客户使用状态恢复到正常,避免或尽量减少因故障而导致的损失。1、启动应急流程在

紧急故障应急措施应以快速恢复客户使用为目标,第一时间将客户使用状态恢复到正常,避免或尽量减少因故障而导致的损失。
1、启动应急流程
在【问题管理】流程中,当服务主管收到服务台人员或助理提交的《运维工作单》,并判断该问题属于重大事故时,则启动应急处理流程。重大事故包括以下几种情况:
l 大范围系统中断
l 区域性系统崩溃
l 关键业务中断
l 大范围病毒爆发
l 系统严重破坏
l 数据严重破坏
根据重大事故的紧急程度和状态不同,服务主管可采取以下方式启动应急流程:
 
u 当紧急事件发生时,投标人的运行人员首先要进行故障分析,确定故障的范围和程度,确认为紧急故障的,在查找原因和解决问题的同时,要同步将故障解决情况通报给部门领导、及向客服中说明事件发生的状况。如需其他部门协助的,需要请求相关部门共同尽快解决故障。
u 对于网络中断事件,投标人的运行人员首先要判断中断原因,如果是局域网本地设备或线路造成的,依网络运行处理流程优先快速处理;如果是电信服务提供商造成的,要立即联络电信技术部门解决问题。
u 对于系统故障事件,投标人的运行人员首先要启用备用系统,再判断故障类型:硬件损坏、操作系统故障、软件故障。硬件损坏的情况,首先向服务器供应商报障;操作系统故障多数情况都和硬件故障同时出现,处理方式相同;软件故障如果是由购买的软件造成的,立即向软件厂商寻求技术支持;如果是公司自行开发的软件,立即向相关人员联系并排除故障。。
u 对于自然灾害性事件,运行管理人员要尽可能将设备转移到安全地带,将损失降低到最少。
u 对于电力中断事件,由于机房多采用UPS防止断电带来的系统停机现象,在UPS还能供应电力期间恢复供电,对系统使用不会有影响;但遇到特殊情况导致供电部门在短期内不能恢复供电时,如有备用发电设备要启用备用发电设备供电,否则要关闭所有设备,确保突然断电造成设备损坏。
u 在故障排除之后,运行管理人员要填写故障记录,如果故障是由于项目实施中存在的隐患造成的问题,具体操作请参见上层文件《系统维护管理指引》。故障记录汇总到“系统运行故障记录表”,重大事故由故障处理人填写故障报告。
2、成立应急小组
《启动应急流程申请单》获批准后(包括口头批准),由信息主观部门负责组建应急小组。应急小组由多方人员组成,例如信息中心代表、运维部代表、服务主管、客户代表、供应商代表以及其他第三方人员等。
应急小组对发生的重大事故进行讨论分析并制定应急处理方案。
运维小组会根据实际人员需求情况从公司本部调配足够人员加入到应急小组。
运维小组会根据实际需求情况从公司本部调配足够的资金以保障事件处理经费需求。
3、应急处理过程
运维服务商根据应急小组制定的应急处理方案具体实施应急处理活动,并将实施过程和结果记录在《应急处理过程记录》中。涉及到客户现场服务的应取得客户的签字确认。
应急处理实施过程中涉及需要协调配合的工作由服务主管填写《资源申请单》,说明需要获得的资源、需要协调配合的工作等,经应急小组审批通过后由相关人员代表配合实施。
应急处理实施过程中涉及需要采购的,由服务主管填写《资源申请单》,说明需要采购的产品名称、型号/规格/功能、厂商/供应商、费用等。《资源申请单》经应急小组审批通过后由运维工程师实施采购,并将采购过程和结果记录在《资源申请单》中,应急小组对采购结果进行确认。
应急处理实施过程中涉及需要变更的,由服务主管填写《变更请求表》,说明变更内容、变更原因、变更方案等,经应急小组批准后直接由运维工程师根据《变更请求表》中的变更方案实施变更,并将变更过程和结果记录在《变更日志》中。
所有应急处理活动均应记录在《应急处理过程记录》中。
具体涉及到网络紧急故障处置,我们以恢复使用为第一目标。
在确认设备故障情况下,将第一时间采用备机备件恢复网络功能;
在链路故障情况下,启动备用链路进行通讯恢复,并积极配合链路运营商恢复链路;
4、应急处理结果评估
应急处理过程完成后,服务主管向应急小组提交应急处理过程相关表单,包括《启动应急流程申请单》、《应急处理过程记录》、《资源申请单》、《变更请求表》、《变更日志》等。应急小组对应急处理结果进行评估和确认,并在《应急流程评估单》中填写评估意见。
如果应急小组评估意见为达到要求(即问题得到解决并恢复服务),则应急流程结束。
如果应急小组评估意见为未达到要求,则由应急小组讨论分析原因,根据分析结果可采取以下措施:
l 如果需要继续进行应急处理,则由应急小组提出应急处理方案,进行应急处理过程;
l 如果不需要继续进行应急处理:
ü 如果有新的问题产生,则由服务主管填写《运维工作单》,转【问题管理】流程处理;
ü 如果有新的变更需求,则由服务主管填写《变更请求单》,转【变更管理】流程处理;
ü 否则应急流程结束。
应急流程结束时,由服务主管在《运维工作单》中记录应急处理结果及关联表单编号。配置管理员对应急处理结果进行检查,登记新的配置项或更改后的配置项。
5、统计和报告
由助理每月或每季度对应急流程情况进行统计,形成《应急流程管理报告》,并提交给服务主管。《应急流程管理报告》内容包括:启动应急流程次数(不同类别的次数)、原因分析、影响分析、完成情况、所需时间、各项资源利用情况、费用情况、意见和建议等。
《应急流程管理报告》经服务主管确认后提交数据部。
应急流程管理报告填写指南
编号:(格式为XXXX-日期+两位序列号,其中日期按“yyyy+mm+dd”格式,2位序列号根据日期从01起顺序递增,例如XXXX-2015031401,表示2015年3月14日第1张应急流程管理报告。)
报告日期:年月日至年月日(统计时间段)
应急流程完成情况统计 (分类统计应急处理次数、完成次数、应急处理分布范围等)
应急流程原因及影响统计 (对引起应急流程的原因以及重大事故影响进行分类统计分析)
应急处理时间统计 (对应急处理所需时间进行统计)
资源利用情况统计 (对应急处理所需资源进行统计)
费用统计 (对应急处理所需费用进行统计)
出现的问题和建议 (根据上面的统计数据,对应急流程管理提出出现的问题以及对应急处理工作进行优化的建议。)
备注  
 
报告人签名:               服务主管签名:
时间:                       时间:

上一篇:运维保修服务
下一篇:最后一页

地址: 合肥市徽州大道6699号高速•滨湖时代广场C3座1605室 客户专线:0551-64657036 皖ICP备17028564号-1 copyright 2020 安徽银柏电子科技有限公司 版权所有 技术支持:银柏科技