【IT168 信息化】目前全球都在为受到金融危机造成的经济不景气而烦恼着,有调查问到在经济不景气时CIO最关注的问题是什么时,大多数CIO表示最关心的就是IT运维成本过高。
IT运维成本高昂之痛
IT运维管理是指为保障IT系统与业务正常、安全、有效运行而采取的管理活动,包括IT运行管理和IT维护管理。IT运维成本管理,即IT系统运行和维护的成本管理。
IT运维成本产生于哪些方面?一个企业的IT系统是由三部分组成:第一部分是企业的服务器和个人电脑等;第二部是网络设备如交换机、Hub等;第三部分是企业业务应用系统,比如ERP系统、HR和CRM系统等。按照对IT运维的范围定义,所包含的主要内容可归纳为如下7个方面:桌面系统维护、网络系统维护、网络安全系统维护、服务器维护、软件系统维护、机房环境维护、IT固定资产管理服务。
有观点认为,IT运维成本是企业管理最薄弱的一个环节。原因是我们对IT运维成本分析时,发现由于前几年的IT新设备和系统增长很快,IT运维成本不但已经居高不下,而且逐年增加的趋势也非常明显。通过对运维成本的本质分析,我们发现许多企业至今在运维成本方面缺乏统一标准:一方面是运维成本紧张,系统维护不到位的现象;另一方面又存在着对运维成本控制不力,乱用和占用严重的现象。
为什么降低IT运维成本这么困难?
一直以来,很多企业忽视了IT系统建设完成以后的运行维护,殊不知,缺乏规范和低效的IT运维体系就是一个吃成本的“超级大老虎”。
(1)高昂的来电响应式运维成本
在运维过程中,只有当故障已经发生并已造成影响时才能发现和着手处理。这种被动的、孤立的、分散的救火式运维管理模式,不但使IT运维人员终日忙碌,也使运维服务质量很难提高,导致运维人员和业务部门的满意度都不高。
传统的故障来电响应式的IT运维模式不但成本高、响应模式被动,而且局限性已显露无余,往往只能做到“头痛治头、脚痛治脚”的分割式管理。在资金充足的情况下,许多救火式的成本浪费会被隐藏起来。但当经济不景气时,问题就会无处藏身,救火式的被动运维往往是成本高居不下的根本原因。
(2)缺乏规范化运维流程,导致运维成本控制不力
在运维流程上,很多企业没有明确的事件升级标准,即满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到资深工程师处理;没有事件的限级标准,没有建立优先级和解决时限的标准,不能保证事件解决的实效性和资源的有效利用;事件产生后没有明确而唯一的责任人,从而缺乏对事件监控和跟踪机制。这些都使事件/服务请求处理过程中没有形成严格的闭环管理,也没有建立明确的重大或紧急事件处理流程,从而不能保证在事件发生后及时处理,造成许多隐性的流程处理成本。
(3)缺乏明确的运维成本标准,乱占乱用现象严重
业务部门经常会提出一些导致运维成本增加的要求,比如硬件升级、软件维护与培训等。CIO在面对这些内部需求时往往是承担着支出责任,而高层认为谁支出谁负责,这样非IT的业务部门没有为IT运维产生的成本买单,而是由IT部门实际承担了来自业务需求的IT成本。随着IT与业务的不断融合,由于IT成本核算错位,所有的支出均计入IT部门。当经济不景气时,却不但不增加IT运维成本,反而还希望压缩IT编制和预算,就加剧了IT需求和IT运维成本之间的矛盾,乱占乱用现象就更严重了。
(4)缺乏运维成本核算工具,无法真实核算成本
因为缺乏合适的运维成本核算工具,常常造成IT运维成本核算失真。当只看表面进行IT运维成本削减时,会让正常的IT运维处于严重受损状态。因此,如何简单但高效IT运维成本核算,以便更好地满足业务需求,已经成为在经济不景气时IT运维的一个重大挑战。
引入ITIL规范化运维,提高效率节省成本
我们可以看到当要在IT运维上节省成本,重点是要从救火式IT运维转向以提升效率为主的规范化运维上。这时除了技术的保障以外,制度化的保障也很重要。ITIL就是一种好的方法。因此,引入ITIL规范化运维,是提高效率节省成本的立足点。
(1)建立ITIL运维规范化,减少运维随意性的浪费
随着企业IT系统涉及的设备种类越来越繁多、管理地域越来越分散,很多企业的IT服务水平远远跟不上企业规模的扩大。例如,IT部门对于日常运维没有相应的负责人,经常出现用户报故障和问题长时间没有回复。解决上述问题,企业首先需要建立基于标准化的IT运维管理流程。因此,建立标准化、系统化、流程化的IT运维体系,是企业获得快速响应业务的IT运维的第一步。
ITIL(IT基础架构库)一直被企业视为建立IT服务管理流程的圭臬。实施ITIL一方面使IT部门从单一的技术向为企业业务发展提供服务的观念转换,使IT部门和业务部门通过直观易懂的IT服务进行沟通,帮助IT部门的相关人员建立起服务意识;另一方面,ITIL还帮助企业利用非常好的实践为IT部门从人员、流程和技术三方面上提供整体规划建议,为企业提高IT运维管理的效率和降低成本起到关键作用。
(2)设立IT运维服务台,节省处理过程成本
设立IT运维服务台是为了确定运维等级和引入优先处理原则,这也是ITIL的核心流程之一。服务台主要承担:运行值班、故障监控、接受请求、工单派发及问题解决过程中的监测等工作内容。服务台就像是传统产业生产车间的调度,它要进行不断的匹配操作和必要的调研和诊断。例如发生任何一个突发运维事件时,服务台会先检查是不是一个常见事件。如果是就可以由服务台直接解决;如果不是,是否有一些类似的问题已经存在。如果有,则将问题加入该问题库,并提供相应的解决办法;如果没有,则要确认是否建立一个新的问题,并去寻找该问题的根源所在。这时解决问题就不会停留在服务台本身,而是需要二线或三线的支持。之后,由服务台关闭突发事件,并进行跟踪和记录。
因此,运维人员分为一线、二线和三线支持。服务台人员作为第一级问题处理人员,主要解决常规的救火式运维问题。二线的技术专家通过巡检方式检查系统,在一线问题解决不能完成的情况下,二线技术专家将迅速开始问题解决过程,必要时将会到达现场解决。三线技术专家来自产品供应商,在系统故障发生时通过三线专家的介入,使问题解决时间能够大大缩短。
(3)设立虚拟化专家资源池,最大限度节省人员成本
主动式ITIL运维服务的一个重要特征,就是设立虚拟化IT专家资源池,这样能最大程度上节省成本。随着IT技术的快速发展,IT技术的复杂度也越来越高,解决问题与优化系统对专家知识的要求也越来越高。无疑,企业的IT运维也需要更多技术专家的支持,但对于许多企业来说是无法保有足够多的高素质IT专家,这种矛盾显然对IT服务提出了更高挑战。
针对这种矛盾常用的解决方案是:①是建立运维服务流程,通过工具实现流程自动化,在企业内部配备最小数量的必备现场专家。②是对于现场专家无法解决的问题,则依靠社会化的专家知识资源池,企业为使用的运维服务按需付费。因此,建立虚拟化的IT专家资源体系,是提供成本最低而效能最高的IT运维服务的关键因素之一。
如何有效控制运维成本
IT运维是IT建设的核心部分之一,也是最为繁杂的部分。如何有效降低运维成本,是CIO最关注的问题。解决之道的除了引入ITIL外,关键还在于:明确运维定位,尽量在运维服务质量与成本支出之间寻找平衡。
(1)根据企业发展策略,确定运维定位与模式
企业发展战略是决定企业运营模式的依据,因此也必然对IT运维管理模式产生重要影响。目前普遍存在两种IT运维管理模式,一种是集中式自行管理,另一种是IT运维外包。公司发展策略和核心能力打造的要求不同,会导致企业选择不同的运维管理模式。而不同的管理模式,又是导致运维成本支出不同的重要因素。所以说,合理控制运维成本,首先需要从公司战略出发选择最优的运维管理模式。
(2)从用户和业务需求出发,设定适度的运维目标
传统的运维管理目标往往只是一些IT技术性指标,如故障率、故障处理时间、服务质量等。而很少关注这些技术指标背后能够反映多大程度的用户实际感知和业务需求,即使包括一些对用户感知质量的评价,也大多是难以量化评价、缺乏客观依据的指标。结果是IT部门花大力气提高了各种IT运维技术指标,还经常以某几个关键运维指标的改善引以为豪。但从用户角度看,这种运维投入是没有带来多大的实际效果。因此,CIO必须从后台走向前台,明确IT运维目标和技术指标,进而确定适度的IT运维投入规模和方式,使得运维每一分钱都物有所值。
(3)强化标准化运维管理,力求提高运维效率
运维管理包含人员、岗位、角色等信息,但如果这些信息没有统一规划,就无法进行统一管理。标准化运维流程是把运维各种事情(包括人员,资源,突发事故)分成不同级别,规范运维操作,以便有效的控制运维成本。因此,对于企业而言,IT系统的规范化运维是降低IT运维成本支出的重要因素。
(4)设立自助式知识库,最大限度节省人力成本
自助式知识库是指对IT运维中的典型故障事件和常见问题解答的自助式处理流程。当出现故障时,用户先在自助式知识库寻找解决方法。如果问题没有得到解决,则用户进行自助式申请维护,运维中心为用户每次维护申请都将在运维系统中建立服务档案,并一直实时监控,直到问题得到圆满的解决。因此,自助式知识库能帮助运维人员节省大量的时间,从而节省人力成本支出。