通过建立it运维管理制度提高it运维管理能力,最终提升综合it信息管理水平。参考本IT经验你可以快速建立自己的运维管理流程。本流程将包括监控、变更管理、备份、项目管理、运维支持、例行工作等方面的流程制度。
具体it运维管理制度如下:
一.适用范围
IT运维中心所有人员,技术中心的相关运维人员。
二.执行时间
本制度经分管总经理审批后开始执行;只有在得到相关领导的审批后方可终止;本制度也将会根据实际的情况不断的做调整,经审批后将发布最新制度,同时终止对应旧制度。
三.具体it运维流程
监控方面it运维管理制度:
1. 要求做好各个环节的监控工作(服务器等硬件设备、电话网络、系统、数据库、应用平台监控);
2. 工作日内,运维值班人员8:30分到岗,做例行工作与监控;
3. 监控工作包括实时监控、日监控工作、工作日监控工作、周监控工作、其它监控工作;
4. 实时监控包括:
生产服务器状态;
应用平台是否正常运行;
业务数据库是否正常运行;
统计数据库是否正常运行;
电话网络状况;
5. 日监控包括:
每天监控各台数据库的运行空间、数据库服务器的状态;
每天检查生产数据库、备用数据库的数据准确性;
每天监控数据库的备份情况;
服务器空间使用、性能状况;
6. 工作日监控工作包括:
工作日对统计平台中的数据有效性做检查;
工作日对数据库定时处理程序做检查;
服务器空间;
应用程序器日志;
7. 周监控包括:
其它DBA日常维护工作的检查,详见DBA管理流程;
8. 其它监控包括:
定期对备份数据库做检查,保证其有效性;
9. 各个监控如果发现问题,要求记录到监控日志中;
10. 监控到问题,及时通知到受影响的其它人员;
11. 对于监控到的问题,如果不具有普通性(就是问题是第一次发生,以前没有发生过类似问题),要求向自己的直接主管汇报问题,如已经解决问题,同时报告结果;
变更管理方面it运维管理制度:
12. 生产环境上做任何调整,都要求提前在测试环境测试;
13. 生产环境上的任何调整,都要求对相关的原有程序、原有结构、原有配置做备份;
14. 生产环境上的任何调整,都要求在业务量小的情况下进行:
只是局部的调整,如一台应用服务器的调整,如果调整不成功可以在2分钟内恢复正常,调整对正常的业务影响不大,在测试正常的前提下,可以在闭市一小时后进行;
其它的调整,要求在晚上进行;
重大节假日,原则上不对生产环境做任何的调整;
BEGUG\故障处理例外,但要求及时汇报;
15. 生产环境上做任何调整,都要向直接上级汇报,通过后方可进行;重大的调整要求有调整方案或报告,在得到技术部经理同意后方可进行;
16. 生产环境上的任何调整,都要求记录日志;
17. 生产环境上的任何调整,一定要提前通知到可能受影响的其它人员、通知到相关的业务与运营接口人,并向直接上级汇报;
18. 生产环境上的任何调整,为了防止出现意外,避免人为因素的影响,要求由两个人一起来完成;
19. 调整正常后,要通知受影响的其它人员做测试,确认平台的稳定性、调整的正确性;
备份方面it运维管理制度:
20. 做好自己所负责的部分的备份工作;
21. 生产环境中的设备做冗余备份,出问题后可以及时恢复;
22. 做好数据备份工作;
23. 定期对备份情况做检查,保证其可用性,真实性;
项目管理方面it运维管理制度:
24. 项目负责人负责本项目的跟踪与管理;
25. 项目负责人要及时的把项目具体实施情况向相关人员做汇报;
26. 项目实施过程中出现问题,影响到项目的正常进行,问题自己不能控制,或者问题是由别的部门或别的公司的原因所引起的,要在第一时间通过书面的形式把问题和本项目的相关人员(包括相关负责人)解释清楚;
运维支持方面it运维管理制度:
27. 按要求做好一些日常的支持工作;
28. 为其他人员提供支持与配合;
29. 在答应的时间内完成相应的工作;如果由于其它原因导致不能按时完成工作,要提前一段时间通知对方,并向上一级主管说明情况;
例行工作方面it运维管理制度:
30. 按时完成例行工作;
31. 及时反映例行工作中发现的问题;
32. 例行工作不能完成提前告诉上一级主管;
其它方面it运维管理制度:
33. 运维人员在与其他人员交流过程中,重要事情要以书面与电话方式(其他人员不在现场)通知到对方,如果电话不通,要通过短信的方式通知;
34. 对于运维工作中出现的问题,及时的向一级汇报;重要问题逐级上报;
35. 每天做好工作日志,每周写好工作周报;
36. 执行公司的其它制度。
四.流程解释
1. 本制度主要是为了提高运维中心的一些具体运维工作的效率与质量;
2. 最终解释权归制定者与更高一级的领导;
3. 将根据制度执行人员提出的合理意见不断完善、补充。
上面的it运维管理制度是当年工作中实际执行的制度,在当时的环境中有很大的可执行性。it运维管理现在正在发展成一个相对独立的学科,市面上有很多it运维管理软件,可以实现IT运维自动化,有相对完整的运维知识体系。不过软件购买与相关知识的学习会增加企业运营成本。有兴趣的朋友可以搜索一些“IT运维管理”与“ITIL管理理论”做进一步研究。
建立一个有效的运维管理制度要有一个过程,在前面的文章快速提升IT运维管理能力中给大家提出六点建议,大家可以与本文一起参考阅读。