运维人员的自我修养
Chapter 3 运维人员的自我修养 运维人员在专业技术上的积累这个是基本功了,凡是IT领域的东西都该去多了解一些,主要是技术应用方法了,对于解决常规的业务需求可以拿来即用,对于需要深入理解的方面还是要系统性的学习,建议是去搞清楚整个来龙去脉、找到根源和理论基础,这块涉及的东西太广泛,就不多说,除此之外的以下方面本人觉得往往对个人的成长起到更大的作用。
- 改善沟通 稍微有些职场经验的人都知道,很多时候问题的关键不在于资源、路径或者是技术问题,而在于人的问题,你所在的部门领导、你的leader、流程上下游相关的人、业务相关接口人等等,这些在你处理某个事务时有交集的所有人都可能影响到整个事务的成败。既然是人的问题,就需要通过沟通来解决,在运维工作中,我们涉及的业务接口人、流程相关方、细节信息确认方等经常是错综复杂,有时甚至斡旋于多个团队之间太极打的风生水起,还是搞不清楚这事谁负责,到底该找谁解决。关于沟通方面体会最深的有以下几点:
一次性原则:说一件事情,用最简短的语言把整个事情描述清楚,且让人没有疑问,不要挤牙膏式的给信息。在团队协作做某项实施时,经常遇到这类沟通: A:那谁一会帮忙把DB重启下
B:哪个DB?
A:xxx业务的一区的DB
B:一区DB机器有3个实例,是哪个?
A:3310实例啊
B:现在重启吗,还是等你通知?
A:等我通知。。。
这种沟通可简化为:
A:等我这边把前端停掉,你帮忙将xxx业务一区DB机器(192.168.1.1)的3310 实例重启下,等我通知再操作!
B:好的。
简化,表达清楚,简单的事情一次性说清,不留疑问,配合你的人一看就明白要做什么。
确定正确理解:这个是双方面的,当你更他人沟通事情时,确保他正确理解了你要表达的,没有任何疑问,有时需要再三确认他真的理解了,举一个例子:本人曾经在电信IDC与动力人员配合做电力割接,由于是两路市电,UPS出来到列头分A/B路接服务器的双电源,所以只要两路电不同时停则服务器不会断电,已经跟动力实施人员沟通好,一会先停A路电,割接完成后恢复A路然后再停B路电,他表示已经懂了,结果在实施的时候他还是将A、B路一起停了,五六双眼睛盯着他,表示无限惋惜…。后来想想,如果当时直接在空开上做个标记,按实施顺序编号给动力实施人员讲解可能就不会出问题了。有时他人的理解跟你想表达的完全不同,确定他理解的是你想表达的很重要,尤其对于运维这种高危职业而言。 找对沟通的对象:这个需要运维人员先熟悉整个组织架构和工作界面划分,什么事找什么人,这块内部沟通还好,在外部沟通中往往出现问题,导致非常简单的事情兜了好几圈都没解决,所以找对那个真正负责此事的人来配合你的工作,如你不清楚外部团队的内部分工,就找外部团队接口人。 要主动不要被动:运维作为业务支撑团队,我们的工作安排和计划均基于业务侧运营侧的相关计划,这就要求运维侧要主动去跟上游或周边团队沟通,尽早拿到上游信息,尽早着手安排相关工作,凡是赶早不赶晚。运维工作中其实最难把控的就是突发紧急情况、临时需求变更等等,主动沟通可有效减少这类情况发生,并使运维工作变得有序合理。 一个好的运维一定是擅长跟各种技术和业务团队沟通的好手。
- 优化意识 运维的工作往往很杂、很细、很乱,可能你每天都在处理重复的需求、做着重复的事情,埋头在一堆单调重复的琐事之中无法自拔,基本没有时间去学习新的知识和技能,我相信每个运维都遇到这些情况,每天加班加点、且没有成就感,也输出不了什么价值。如果到了这种状态,我觉得往往是优化工作做的不够。优化,可大可小,从自身出发,可先寻找个人工作中的优化点,一点一滴去做,什么是优化点,简单来说工作中你的痛点就是优化点!很多时候我们需要放下手上的琐事多做总结和思考:
为什么天天加班事情还是做不完,如何提升效率? 为什么每天做重复的事情,有没有固化的自动的方案? 为什么总是在救火的时候出现问题,预案和演练平时有做吗? 小到某个特定的执行细节、大到整个流程体系,甚至要推动多个团队来配合,把这些让你感觉费力的不爽的地方变得通畅,省时省力且质量还能提高,这些应该是最能体现运维能力和价值的地方。
如果运维工作中某个环节让你很不爽,想想问题在哪里,有何可行的优化方案,然后去推动和实施,抱怨解决不了问题,持续优化是很重要的意识,尤其对于运维从业者而言。当然有人可能会说这个问题领导或其他团队不重视,推不动,无法优化,这种情况第一可能是你没有让别人看到优化方案的闪光点和预期收益,只对你方有利却把麻烦抛给了他人,没有制造双赢或多赢的局面,可以再深入下方案,相信对大家都有利的事情都会愿意去做。第二可能是管理上的问题了,公司制度使然,这种情况应该是极少数,就不去挑战了,除非你能把老板优化掉。
- 规划能力 没有人会一直做运维执行和操作,到最后其实更多的是做运维规划,尤其是在做海量业务支撑时,前期的规划往往在很大程度上决定了后期的建设和维护成本。
如何制定服务器资源供给与调度计划? 如何规划网络架构以适配多种形态业务的需求? 某业务上线各节点阶段性的工作安排是什么? 自动化建设的整体规划和实施路径是什么? 如何搭建运维团队,规划人力分配? 大量的运维实施经验和积累后,对于运维中的事务,多从规划角度去考虑,往往能做得更好。
- 学习与分享 这块就不多说了,运维是一门实践性很强的科学,专业众多,保持学习的心态很重要,分享亦是一种美德,更是个人积累和成长的重要方式,每个人都有自己独特的经验和感悟可以分享出去,共同成长。
说了这么多,不知能否改变我那位朋友觉得运维很low的印象。总而言之对于运维价值的体现和提升有更多的事情要做,本文只是杯水车薪。最近看《权利的游戏》,整个影片构建了一个宏大且残忍的史诗级魔幻世界,里面有个置身七国纷争之外的特殊群体——守夜人,一个人只要是失去生活目标了、堕落了、不被社会认同了、或者感觉活腻了,你还有一个地方可以去,那就是加入守夜人团队,从此将摆脱一切身份,洗去一切罪孽,断掉一切念想,活在另一个世界为七国守卫绝境长城。
12
守夜人有非常霸气的誓词,以下献给各位运维同仁:
Night gathers, and now my watch begins. It shall not end until my death. I shall take no wife, hold no lands, father no children. I shall wear no crowns and win no glory. I shall live and die at my post. I am the sword in the darkness. I am the watcher on the walls. I am the fire that burns against the cold, the light that brings the dawn, the horn that wakes the sleepers, the shield that guards the realms of men. I pledge my life and honor to the Night’s Watch, for this night and all the nights to come.【长夜将至,我从今开始守望,至死方休。我将不娶妻、不封地、不生子。我将不戴宝冠,不争荣宠。我将尽忠职守,生死於斯。我是黑暗中的利剑,长城上的守卫。我是抵御寒冷的烈焰,破晓时分的光线,唤醒眠者的号角,守护王国的坚盾。我将生命与荣耀献给守夜人,今夜如此,夜夜皆然】。
–作者简介:张延礼,实践运维专家,现蜗牛游戏高级运维经理,曾就职于腾讯多年,熟悉基础架构运维及游戏业务运维,在运维技术实施、流程及标准化体系建设、运维自动化架构设计及实现,运维支撑体系规划和执行团队管理等方面具有丰富经验。