快速提升IT运维管理能力

中秋国庆即将到来,对于一些从事电子商务、从事互联网运营平台的企业来讲,假期可能还会有一些业务正常运营,中小型的企业没有专业的运维团队,如何短期内快速提升IT平台运维管理能力,在保证运营平台高效运转的同时让更多的员工轻松过节?笔者将从以下几个方面进行论述:

1.完善一个可行性强的假期运维流程与制度
如果企业原来就有运维流程或相关制度,那么要考虑现有流程是否适合节假日内使用。要增加或优化相应的节假日运维流程。可以根据节假日的特点做优化,比如,节假期间很多人是不在工作岗位上,流程中是否有单点责任人环节,如果联系不上此责任人,下一步将怎么进行。流程一定要简单实用,一定要有很强的可行性,要不然很容易出现不了了之的结果。

2.检查重要IT数据、平台的备份是否可用,建立有效的监督体系
这个工作看起来可有可无,但是这么多年来,总能听到看到备份数据异常导致的不可恢复的IT案例。不同级别的领导可以有针对性的对公司的备份数据做不同程度的检查工作。IT运维工作中要有适度的监督管理。一定记住,备份数据检查工作不单只是IT部门的事情。

3.关键IT运维平台要多准备不同的应急方案
关键IT运维平台一定要多做应急方案,可以把实际的故障想得更恶劣一些。比方就ERP平台出现不能正常使用的情况,应急方案中出现“运维人员远程登陆服务器解决问题”的应急办法,那如果ERP服务器所使用的网络也出现了异常又怎怎么办呢?远程登陆这时候就不可行了。多准备一些应急方案一定有好处。

4.重要IT环节做好节前事故演习工作
可以在你的非生产环境平台上做IT故障演习,可以有针对性的做一些恢复与应急的演练。重要环节可以在业务非高峰期在真实的运营平台上做演习,这样能发现更多的问题。当然在做演习前一定要做好相应的备份工作。公司的部分高管,如分管IT信息的总经理也可以参与进去,这样能有更好的效果。

5.节前准备工作尽量提前3-5天来进行
笔者就经历过几次节前准备工作负面影响的案例,原本是想对IT平台做好相关的优化工作,但是由于一些员工的工作疏漏,导致服务异常。分析原因发现,过节期前,本身很多IT运维人员要配合运营人员做很多平台调整;再加很多人早已经心不在公司,这样会使工作失误的概率增大。所以建议节前准备工作尽量提前3-5天进行。如果节前准备万一出现问题,相关同事都在上班,方便及时解决问题。

6.要有一个有效的沟通机制
有一个真实的例子,放假期间,公司运营人员下午发现短信运营平台不能正常使用,打电话联系运维人员。打了十几个电话也打不通,总提示“电话不在服务区”。然后该运营人员在晚上才打电话联系到运维人员,运维人员解决了问题。到公司后运维人员说运营人员没有联系到自己责任在运营人员;运营人员说打了很多电话都联系不上运维人员,责任在运维人员。所以一定要建立一个有效的沟通机制,比如,打电话打不通,是不是可以发条短信。运维人员看到短信后要及时与运营人员联系。要根据企业实际情况制定一个高效的沟通机制。

当然,IT运维管理能力的提升,还有很多方面要加强,比如知识体系的建立,团队的建设等,本身也是运营管理的内容,是一个长期的过程。但希望上面几点建议对你快速提升IT运维管理能力能有所帮助。

3 comments to “快速提升IT运维管理能力”
  1. 流程化的东西是保证不出问题的关键。备用数据一定要定期检查,很多大的国企也出现过类似的数据异常问题。但是很多公司领导不会太在意这些。

  2. 关键是投入问题,还有就是运维工作好坏要有一个有意义的考评,要不然很多流程都成了形式

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注