【IT168评论】随着网络应用的飞速发展,客户对企业级网络应用的稳定性,安全性以及各种性能指标都提出了更高的要求。SNAPPiMON (Systems Networks Applications integrated Monitoring) 作为IBM旗下的一款简单易用的性能监控和管理软件,在对包括网络,系统以及应用程序在内的分布式系统的各个环节进行监控和管理的同时,还提供了相应的诊断,分析和预警功能。它帮助笔者所在的技术支持团队同时成功的管理和监控了多个大型IBM企业级解决方案。本文将以其中一个较为复杂的分布式系统应用方案为例,具体介绍该软件是如何帮助用户实现对较为复杂的网络应用的管理和监控,从而防患于未然,让降低人力成本同时提高客户满意度成为可能。
1. SNAPPiMON概述
尽管对于网页版企业应用的用户来说,所有的工作看上去都只是靠一个小小的浏览器来完成,但在每一个大型的企业应用背后,无不包含了诸如服务器,数据库,中间件产品在内的很多元素。因此,确保每一个关键环节的可用性和稳定性,是企业应用可否流畅使用的前提。而SNAPPiMON正是一款集成的多功能的信息管理软件,它可以对包括网络环境,系统性能以及应用程序在内的企业应用系统的各个环节进行管理和监控。同时,它也是一款符合ITIL (Information Technology Infrastructure Library,信息技术基础架构) 规范标准的网页版企业管理应用,为用户提供了一个系统管理的统一视图。
基本的信息系统架构通常由网络,系统和应用程序组成。SNAPPiMON采用SNMP(Simple Network Management Protocol,简单网络管理协议)监控网络环境上包括路由,网桥,交换机在内的各个节点,同时利用分布式容器(container)收集和处理系统及应用程序的相关数据。
SNAPPiMON主要由以下两个部分组成:
· 中央管理器,用于配置系统环境,设置报警信息,生成性能报告以及管理各个远程代理。
· 分布式容器,主要用于数据的收集。一个中央管理器可以同时拥有一个或多个容器。根据监控对象的不同,容器也相应的分成网络监控容器和系统&应用监控容器两种。
2. IBM企业级某解决方案概述
简单的说,该企业级解决方案是根据不同企业业务流程定制的电子文档处理系统。为了简单起见,下文中我们讲其称为SAMPLE方案,其基本流程如下图所示。
SAMPLE后台采用典型的分布式结构,核心系统由SFTP,HIS,WAS,LDAP和CM/DB2五种服务器组成。
${PageNumber}
3. SNAPPiMON的基本配置和管理
3.1 配置系统层级结构
为了与信息系统架构中各个层次的元素相对应,同时也为了更加清晰的表达业务逻辑,SNAPPiMON 中定义了区域(Region),地理位置(Location)和Business(业务)三个分层。
· 第一层:区域层,例如:南方,北方等
· 第二层:地理位置层,例如:城市,省份等
· 第三层:业务层,例如:部门,具体业务等
用户可以根据特定的业务逻辑定义自己的分层。以笔者所在的技术支持团队同时监控的几个IBM解决方案为例,由于我们的数据中心分布在北美的两个不同城市,因此我们将区域层设为北美,地理位置层分别设置了这两个城市。另外,由于我们同时支持了包括SAMPLE在内的几个不同的解决方案,业务层很自然的按照解决方案来划分。
3.2 配置容器 (Containers)
容器是SANPPiMON中一个用来监控系统,应用和网络环境的重要控件。配置容器需要提供包括IP地址,端口等在内的详细信息。
一个SNAPPiMON管理器可以关联一个或多个容器,而容器又可以根据功能进一步细分,比如可以用不同的容器分别监控系统环境和网络控件。当然为了简单起见,也可以像SAMPLE一样,统一使用同一个容器进行监控。
${PageNumber}
4. 网络环境的监控
4.1 配置网络元素
网络环境通常由路由器、网桥、链接、子网、交换机和设备等元素组成。为了通过SNAPPiMON完成对网络环境上各个元素的有效性以及各种性能指标的监控,我们首先要根据具体的网络拓扑结构进行相应的配置。
以子网配置为例,配置子网需要提供如下参数。
就SAMPLE而言,从图2的SAMPLE系统架构图中我们可以看到,根据不同的安全级别,SAMPLE的网络结构进一步细分成了黄区和绿区,因此我们也将SNAPPiMON的网络配置中的子网配置设成相应的黄区和绿区。
再以设备(device)为例,硬件设备是网络环境最底层的组成部分。SNAPPiMON提供了自动和手动两种方式对包括打印机,服务器,工作站等在内的硬件设备进行配置。手动配置需提供如下信息。为了对SAMPLE进行全面的监控,我们将图2中用到的所有服务器都配置到了SNAPPiMON中。
另外,SNAPPiMON还提供不同视图的拓扑结构图,方便用户更直观的使用。
${PageNumber}
4.2 利用模板配置网络设备
对于很多同类型的设备,需要监控的内容也大致相同。SANPPiMON提供的模板机制可以帮助用户节省很多重复劳动。同样以SAMPLE为例,对于网络设备,我们主要关心和监控的是它的有效性,因此,我们首先设置了有效性监控的模板如下。
再用该模板对所有同类型的设备进行配置。