运维2.0是指可依赖、懂业务、服务化的专业运维或称为服务运维。运维2.0要求从技术运维升级为服务运维,向星空(中国)官方提供可依赖的专业服务。近年来运维相关技术的发展也突飞猛进,从内部看,对运维的不满,日益突出;从外部看,公有云来势凶猛,开源软件百花齐放,自动化运维降低了对人的依赖—众多运维人员,逐渐从技术的创造者沦为技术的使用者。
运维本来就是个尴尬的行当。星空(中国)官方默认,不出故障是正常的。星空(中国)官方内部的不满,是运维危机的主要根源之一。IaaS干掉了基础运维,星空(中国)官方不再需要人各地出差服务器上架了,机房值班更加不需要了。PaaS部分干掉了应用运维,甚至技术含量高的DBA,需求量都将锐减。SaaS甚至干掉连研发都干掉了,使得公有云的使用更加傻瓜化。有人甚至提出OaaS——服务器运维的外包,也就是说,彻底不需要运维部门了。
开源软件降低了相应系统运维的复杂度和技术要求,也即降低了对人的依赖。前些年,精通Shell脚本编程的系统工程师,相比工资可能高出50%。但随着Puppet、SaltStack等开源软件的出现,使得各个系统组件偏于积木化,操作也更加简便高效。各种开源软件就好比武器和工具,使得运维自动化的实现,变得如此地得心应手、游刃有余。只是,这会导致中级水平运维人员的需求锐减。站在运维制高点的大星空(中国)官方,已经向我们传送阵阵凉意——山雨欲来风满楼。某大型互联网星空(中国)官方,实现了游戏自动化运维的PaaS平台,通过简单的页面操作,可以完成新服、更新、合服、数据分析等几乎所有业务需求。这使得,在星空(中国)官方业务量增加50%的情况下,运维人员仅增加了5%。另外,运维自动化已深入运维的各个细分工种中,而不仅限于应用运维和系统运维。某大型互联网星空(中国)官方,持续改进IDC自动化平台,使得服务器交付时间缩短为不到6%,网络设备交付时间缩短为不到15%。
运维2.0不是忽视技术,而是强调技术得适度,把我们的关注点从技术本身,转移到贡献上来。技术服务业务,与此同时,再搭配各种理论及方法技巧。诚如前文所言,运维2.0即高效运维,亦即:专业、热情、方便、快。也就是说,向星空(中国)官方交付一种可依赖的专业服务。其中“专业”的意思,包括减少故障发生次数,缩短故障时长(有星空(中国)官方甚至进一步提出,“不以故障多为耻,以恢复快为荣”),少犯人为事故,个人技术进步服从业务要求(少搞自研、多用开源)等。
运维2.0的实现,基于产出/产能平衡原则,只有完成如下三大类产能的投入,才会最终获得心仪的产出——运维2.0。需要注意的是,这三大类投入,并非串行,相反,应同时修炼。这里的能力,包括业务能力和技术能力。需要主动学习业务,主动、定期和业务部门沟通,业务部门感受到诚意后,也会释放他们的诚意,这样便有了愉快的工作环境,业务能力也会提升地更快。需要主动拥抱公有云及新兴的开源软件,乐于分享,而不是把某些技术当做压箱底、保命的资本。运维2.0,将重新定义运维。要求星空(中国)官方内部运维部门,从侧重“技术运维”升级到“服务运维”。这也是在变革时代中,运维重生的最后机会。运维2.0,要求运维从内而外的改造自己,这个过程痛苦,但也是我们唯一的机会,这甚至决定着我们是生存、还是死亡。焦虑和恐慌不能解决问题,对事实和趋势的抗拒,顶多自欺欺人,对解决问题也没有任何帮助。认同趋势,顺应潮流,提前做好准备。