APP下载

【武汉肺炎对策:企业持续营运的考验】面对突发性灾难,双鸿靠持续优化对策满足企业持续营运需求

消息来源:baojiabao.com 作者: 发布时间:2024-04-29

报价宝综合消息【武汉肺炎对策:企业持续营运的考验】面对突发性灾难,双鸿靠持续优化对策满足企业持续营运需求

双鸿科技花了4个月时间,于2016年订定了企业持续营运计划,后续再进而订定灾难复原计划,提前为各类突发情况预备对策。

图片来源: 

双鸿科技

武汉肺炎(COVID-19)疫情持续延烧,制造业也遭受冲击。面对突发状况时,企业平时是否落实持续营运计划的规划工作,显得更为重要,身为2千大制造业的双鸿科技,回顾自身建立企业持续营运计划(BCP)的机缘,揭开了制造业IT应变作法的神秘面纱。

“若大型主机坏掉,资讯团队需多少时间才能还原设备和系统?”双鸿科技资讯室协理林伯勋回想2015年一次简报会议上,董事长向IT团队提出了这个问题。经资讯团队评估后发现,还原硬件设备和系统约需半个月时间。

双鸿从2007年开始落实备援机制,但只限在地的单机备分与备援,没有建立异地备援机制。林柏勋表示,不像PC设备可直接购得来复原,大型主机若是坏掉,需先向厂商订购设备、等厂商将机器送到位,并待机器架设完成,才可进行系统还原的工作。

以散热模组起家的双鸿,每年全球出货量都名列前茅,并无法容忍系统中断半个月。一旦关键系统像是ERP中断,就会全面影响营运,造成严重的损失,且双鸿旧有备援机制的系统还原演练,只限各套系统自身的备份还原动作,未将企业整体的业务架构纳入考量。林柏勋指出,若有灾难发生,双鸿并无法掌握会受波及的业务范围,以及业务将受影响的程度及时间。

全面盘点业务架构和IT系统,以订定BCP预备灾难对策

经过该次模拟评估,双鸿认为系统中断造成的灾难,不可忽视,于是,全面盘点了业务架构和资讯系统,花了约4个月的时间,以满足客户的交付需求为目标进行规划,于2016年订定BCP,涵盖了各特别事件包含地震、台风等天灾,还有公用事业供应中断、劳力短缺、关键设备故障,以及与资讯部最切身相关的IT系统损坏等情况。

在这份规范中,双鸿详列了各部门面对各种可能的突发性事件,需肩负的职责和握有的许可权,并针对各类特别事件明列运作准则,以及因应对策,其中包含IT系统发生损坏时,像是:内外网络断线、应用软件损坏等,各部门负责人须立即提报问题,由IT工程师确认处理,而若修复时间较长,各部门负责人需通知销售服务中心,以通知客户并协商对应方法。

林柏勋也提及如何从资讯角度看BCP,他认为,聚焦的部分应是IT如何支援企业持续营运。首先,以企业整体营运为基础,评估哪些攸关企业持续营运的项目与IT有关;接着,评估这些项目会影响的层面,规划并订定对策和规范;下一步,才进而针对突发事件对资讯系统造成的冲击,订定灾难复原计划(DRP)。

DRP可视为BCP的关键环节,为订定DRP,双鸿从4大面向分析业务架构,剖析BCP,包含了风险因素、业务关键性分析、IT现况分析和技术恢复分析,从而可获得3项分析结果,分别是:灾难恢复时间目标(RTO),也就是双鸿可容许服务中断的时间;以及灾难复原点目标(RPO),指当双鸿服务复原后,取得的恢复资料对应的时间点;还有IT可行性分析。

双鸿再以这3项结果为基础,订定DRP,以规范复原动作如何推展,内容包含了资料备份与还原应遵循的步骤,还有业务持续性的步骤,以及资讯灾难等级说明、资讯系统回复等级等。

以业务持续性步骤为例,首先,他们从评估受灾等级和状况开始,标准包括灾难破坏情况、业务影响程度、机房重建选址,以及挽救的设备清单和测试情况;下一步,公司会对外发布受灾声明,说明业务影响及IT损坏情况;而后,他们将制订复原实施方案,一步一步重建资讯环境和系统,从重建资料中心、网络系统,到重建生产系统,再经过系统全面测试,最后,系统才可全面复原执行。

另外,双鸿依灾难对资讯系统的影响程度,将灾难分为下列四大等级,而各层级有不同的行动准则。第一级,也是对系统影响最大的情况,当重大灾难导致系统全面无法执行,同时,资讯系统场域毁损,导致人员无法进驻,像是断电、地震等。这时,双鸿会切换备援系统,并于IDC机房设立临时处理中心,让IT人员转移,此外,通知协力厂商进行复原。

第二级则是当灾难造成部分系统无法使用,而人员仍可进入资讯场域办公,像是ERP中断,但人员电脑可上网。对此,双鸿会切换备援系统因应,并通知厂商复原。

第三级为人员电脑大规模无法使用,像是个人电脑遭遇病毒感染,影响电脑自身、系统等运作,严重甚至可能危及整个公司的营运。因应此情况,双鸿IT人员会协助复原,隔离受影响的资讯范围,阻绝灾害扩大。最后,第四级为人员硬件设备发生问题,像是程式异常,造成人员无法操作业务,双鸿IT团队则会协助修复。

除了灾难分级对策外,双鸿在DRP中,也依系统对公司营运的影响程度,系统是否有可替方案,以及回复速度将衍生的成本等因素,以4大等级订定系统的回复时效。

第一等级为会造成企业的业务严重损失的系统,包含ERP、邮件系统、网络等,系统回复时效为4小时;第二级为会影响企业长期营运,并影响人员作业效率的系统,包含PLM、BPM等,最迟要在3天内回复。林柏勋指出,BPM若中断,电子签核流程可使用纸本代替,再透过邮件系统传递。

第三级则为影响单一厂区人员作业的系统或设备,像是MES、打印机等,回复时效加长为3至7天。林柏勋表示,MES系统分散于各地工厂内,且若中断可改采手动报工,不影响产线的生产作业。第四等级是会影响个别人员作业的设备或系统,例如,个人电脑、笔电等,回复时效可大于7天。

因应DRP中订定的资料灾难备分与复原准则,双鸿于2016年也着手建立异地备援机制,将属于第一级复原时效的系统,列为异地备援对象,并选择了IDC机房作为备援场所。林柏勋提到,当时曾考虑租用海外机房,后来他们考量管理便利性,像是进行还原演练需至机房做设定,而选择了在台的机房,不过他提到,考量灾害威胁,该机房与自有机房位处不同区域。

DRP随业务影响分析结果调整,以符合企业持续营运的需求

林柏勋强调,DRP非固定不变的办法,而是随着RTO、RPO和IT可行性分析结果的变动,而进行调整,再依新复原点的定义,重新进行系统测试及演练,最后,再进行系统维运。

然而,百密总有一疏,就在BCP订定完成后的同年9月,中度台风梅姬侵袭台湾,造成全台破百万户停电。位于新北市的双鸿也是受灾户之一,停电约半天,导致其系统全面中断,全球业务都受波及而停摆。林柏勋表示,以邮件系统造成的影响最剧,少了该系统,人员无法联系各地客户,且当时该系统非异地备援的对象。

大停电让双鸿发现邮件系统的重要性,事后重新进行业务影响分析,而该系统的RTO和RPO皆提升,双鸿进而调整DRP,来提升该系统的回复等级。邮件系统因而从原先需8小时复原,属第二等级,缩短为现今4小时内复原,属第一等级,并成为异地备援的对象。

除此之外,双鸿在2017年翻新ERP时,也重新检讨了既有的备援计划,进而调整还原演练的流程,订定了新的DRP。面对当前的武汉肺炎(COVID-19)疫情,双鸿甚至重新检讨了BCP,纳入远距工作机制使用VPN的抗疫对策。文⊙黄郁芸

2020-02-20 17:55:00

相关文章