信息化 频道

上海市规划和国土资源信息化运维管理

  【IT168 信息化】

  摘要:上海市规划和国土资源信息化运维团队从专注技术向运维管理转变。以优质服务,面向业务、面向客户来开展IT运维工作。

  关键词:IT运维;一站式服务;服务交付;服务支持;ISO20000

  中图分类号:P23  文献标识码:A  文章编号:1674-3695-(2010)01-43-07

  引言

  上海市房屋土地资源信息中心〔以下简称中心)肩负着全上海市规划国土局和住房保障局电子政务信息系统建设的重任,其服务范围包括规土和房管两局机关用户以及下属事业单位、区县两局和交易中心两级用户、区县下属房地办土地所二级用户以及信息中心内部科室。服务工作除了信息系统运维外还包括其主干网建设与运行维护的使命。中心致力于提供安全、高效、快捷的IT运维。近年来,随着市局信息化建设的深入,各种业务管理逐步信息化,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、核心数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、银行查询、行业企业用户、市民百姓等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全稳定地运行,为用户提供良好的服务并及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,确实是保障日常业务正常稳定运行的关键所在。

  为了满足中心业务的需求,提升管理水平,IT运维就需要上升到更高的IT运维管理体系的层面。IT运维管理体系有两条主线,其一是针对客户的,其二是针对用户的。客户的要求就是IT运维服务的目标,也就是SLA(服务级别管理),具体可分解成运维团队管理、能力管理、可用性管理、业务连续性管理和财务管理,专业地讲也叫作IT服务交付;用户是指IT运维服务的服务对象,服务核心就是拥有服务台和事故管理,具体可分解成问题管理、变更管理、发布管理和配置管理,专业地讲也叫作IT服务支持。

  2IT运维服务的目标

  IT运维服务的目标是整个运维工作的重点,只有确定了目标才能开展好工作。作为一个技术人员往往乐于沉浸在具体的技术工作中,很少关注业务的发展需要。而作为一个运维团队则首先要将自己的工作目标与业务目标紧密相联,变被动支持为主动服务。

  运维服务的作用从中心工作重点来讲是需要保障数据的安全性,保障业务的连续性。简而言之就是——确保系统不瘫、数据不丢。我们建立了上海规划和国土系统运维团队的运维服务方针和服务口号,明确了工作方针、目标和工作宗旨,有效凝聚了团队的工作热情。

  运维服务方针是:“一个中心,两个基本点:以服务为中心,确保运行安全、信息安全”。

  运维服务口号为:“安全、专业、规范、高效”。

  运维服务目标是:

  (1)系统无重大故障,保持高可用性

  (2)始终保持足够的能力余量,以不变应万变

  (3)建立业务连续性计划并定期演练

  (4)确保信息安全

  为了能够更准确的说明运维目标,结合上海规划和国土系统的目前实际情况,我们提出了三年内运维目标量化的指标:

  高可用性:目前为99.9%

  足够的能力余量:

  电力:利用率低于60%

  存储:15K转速FC磁盘的SAN存储利用率低于70%,7.2K转速SATA磁盘的SAN存储利用率低于50%;

  核心小型机:CPU利用率低于50%,SAN和网络带宽利用率低于40%;

  内外网虚拟机:始终分别保持有三台高性能计算机(目前参考DELL R71O:4个E5520的CPU,72G内存)冗余。

  网络:流量利用率低于50%

  建立应用级灾备中心,切换时间小于8小时,通过BS25777认证

  通过等级保护三级测评,通过ISO27001认证

  同时,为了规范服务内容,提高服务质量,经过和服务用户的深入讨论,我们进一步的建立了SLA(服务级别管理)。

  在SLA中,我们定义了从客户角度更详细的指标。如:服务台热线支持服务,服务时间5天*9小时、每个电话接通小于10秒、客户满意度高于92%,等等。这样就把概要性的工作目标进一步展开为可实际执行和考核的工作内容。限于篇幅,对于中心其他SLA要求就不做介绍了。

  3IT运维服务的交付

  根据SLA的要求,运维服务交付进一步展开为运维组织管理、能力管理、可用性管理、业务连续性管理和财务管理。

  运维组织管理是一个运维技术人员选聘、考核、培训的流程。根据SLA的要求,以及数据中心的技术架构,我们制定了组织结构,明确了各个岗位的职责和要求;同时根据目前的人员配备计划,制定了人员选聘、外包服务人员的要求,以及人员的培训计划。经过三年的运作,搭建完成了组织完善、岗位明确的组织体系,并且拥有了一支工作规范、技术过硬、业务精通的技术队伍,有效地支持了运维服务工作。

  能力管理是一个对IT资源的服务能力进行有效监控和管理的流程,通过监测工具对服务资源进行监测,然后提取监测数据进行分析,来掌握当前资源的服务能力,及时地调整对象的配置情况。除此以外,它还可以预测未来所能提供的服务。

上海市规划和国土资源信息化运维管理

  主要内容有:根据服务级别协议中定义要求的能力服务条款,制定资源服务对象的监测范围和指标,以及监测周期、阀值、方法和技术等;根据能力监测数据,进行能力分析,编制报表;根据能力运行周报,提出服务改善计划;根据用户要求进行能力现状调查,收集服务级别协议、事件问题记录、配置项等的资源服务对象的监测数据;分析现有能力与当前服务级别和预计要求之间的差距,并提出改善技术建议给用户。

  目前,上海规划和国土系统已经建立了全面的监控系统,涵盖了机房的空调、电力、消防、门禁、摄像,小型机、数据库、存储、网络、PC服务器、Vmware虚拟机、内外网同步、磁带备份等所有的内容。同时,在日常工作中,每周生成一份近百页的设备能力报告,对小型机、网络、数据库、存储等各系统性能进行全面分析,从而可以判断系统能力变化趋势,及时发现系统隐患,采取纠正措施。此外,我们还制定了全年的能力报告,分析全年的系统性能信息,从而可以科学的决策下一年设备采购计划。

  可用性计划是一个对IT资源的可用性进行有效监控和管理的流程,它建立和维护与业务需求相一致的IT服务可用性计划,在明确的业务和用户需求的基础上制定的IT服务可用性计划,最大化地支持业务的发展和用户的工作,符合组织的最大利益。

0
相关文章