信息化 频道

基于Tivoli实现对IBM Power CEC的监控

  【IT168技术】IBM Tivoli Monitoring (以下简称ITM) 作为一项专业成熟的监控解决方案正在被逐步广泛的应用于各种行业。由于这个方案的被广泛应用,并在企业里带来很大成本效益,为IT硬件的开销节省了很大的开支。 本文就以使用IBM Tivoli Monitoring Agents for System p监视代理程序对IBM Power Systems环境的集中监控进行相关的探讨,但由于IBM Power Systems的强大及其范围之广,故仅对Power Systems中的CEC部分的监控进行探讨,希望可以起到抛砖引玉的作用。

  本文将从如下几个部分来进行阐述:

  IBM Power相关知识概述

  通过ITM实现PowerVM的完整体系的监控

  ITM CEC Agent的安装与配置

  ITM对Power System中的CEC监控的结果展示

  ITM 监控相关经验总结

  1. IBM Power相关知识概述

  Power Systems是IBM将原有的System p和System i两个系列的主机整合成一个新的产品系列,是IBM对小型机产品进行一次全面的整合和升级,同时推出了全新的PowerVM虚拟化平台,进一步提高了系统的虚拟化的性能。接下来先对Power Systems、PowerVM的相关概念以及Power系统的监控需求做一个基本的说明:

  1.1 Power Systems概述

  1) Power Systems是IBM基于Power处理器的所有服务器系统的统称,通常也叫IBM P系列主机。

  2) CEC在Power Systems中的结构

  CEC全称是Central Electronics Complex,也可以解释成中央电子单元,具体来讲就是一个主机单元里的Drawer,CEC主要包含主机的CPU、Memory、PCI Backplane...部分等。

  下文中介绍的ITM CEC Base Agent就主要是针对Power Systems中的CEC单元进行监控。

  1.2 PowerVM概述

  PowerVM是在基于IBM Power处理器的硬件平台上提供的具有业界领先水平的虚拟化技术,它是IBM Power Systems虚拟化技术全新的品牌,是一个包含一系列硬件和软件特性的品牌。 同时包含微分区、动态逻辑分区、虚拟I/O、Hypervisor、PowerVM Lx86、活动分区迁移等高级特性。这些新特性几乎可以将服务器上所有的物理资源虚拟化,并为客户提供更好的高可用性和资源利用率。

  Power Systems是通过 PowerVM 软件体系实现对各种硬件资源实现了虚拟化, 其中相关的概念包括以下几个部分:

  LPAR: 即逻辑分区,Power Systems 中的虚拟化是通过逻辑分区的方式来实现的,即将一个物理的服务器划分成若干个逻辑的服务器,每个逻辑的服务器运行自己独立的操作系统,每个逻辑分区在创建时可以分配到 Power 服务器的硬件资源,有自己独享的处理器、内存和I/O资源,一个 LPAR 是应用程序执行的资源集合。

  Power Hypervisor: Power 系统固件中提供的基础软件,它为 LPAR 之间资源共享以及各自独立运行提供支持,并为所有资源的虚拟化提供底层支持。

  VIOS: 即 Virtual I/O Server,为 I/O 设备和网络适配器的虚拟化提供支持, 它需要以一个 AIX LPAR 为载体运行于 Power 服务器中,作为 I/O 资源设备的服务器为其它的LPAR 提供虚拟化支持。

  其结构如下图所示:

基于Tivoli实现对IBM Power CEC的监控
▲图 1. 包含分区和虚拟 I/O 服务器的 Power 系统

  1.3 Power Systems监控的需求

  Power Systems以其优异的性能、极高的稳定性和安全性在服务器市场始终保持着领先的地位,以及Power Systems在使用Power VM实现了虚拟化之后,更是以其强大的虚拟化性能、更高的运行效率、更好的扩展性、更便捷的虚拟化管理赢得了高端企业的青睐。

  PowerVM虚拟化平台在企业内部实施运行之后,给企业带来巨大收益的同时,虚拟化后是否真正带来资源的充分利用,计算资源是否满足现在以及未来项目发展的需求等问题随之而来。特别是对于一个大型的Power环境而言, 如何针对整个PowerVM环境进行集中有效的监控成为了企业管理者的难题。

  IBM Tivoli Monitoring是一套完整的企业集中监控解决方案,它可以监视和管理主机环境中的操作系统、数据库以及应用程序等,并可以通过对资源的长期跟踪找出存在性能瓶颈的设备并进行预防管理,在资源的可用性与性能在最终影响业务之前及时的发出警告,以最大程度的减少事故发生的概率,做到防患于未然,从而提高企业运营的效率。同时可以提供监控历史数据的报告以便对问题进行故障诊断。对于Power Systems环境,ITM针对Power Systems提供了一系列监视代理程序来满足企业监控的需求,下文就对具体的监控内容进行探讨。

${PageNumber}

  2. 通过ITM实现PowerVM的完整体系的监控

  通过IBM Tivoli Monitoring可以提供监控 Power Systems服务器的资源使用状态、健康状况,以及对系统性能的分析,通过实现在一个集中控制台中同时提供AIX 操作系统、逻辑分区 (LPAR)、Central Electronics Complex (CEC)、硬件管理控制台 (HMC) 和虚拟 I/O 服务器 (VIOS) 资源的丰富的图形视图,从而提供强大的监控能力。 并可以根据需求预先定义出警告的阀值,以实现主要指标的告警。 同时,用户还能够在Tivoli Enterprise Portal Server中查看监控数据,以确定AIX、LPAR、CEC和VIOS资源的当前状态。

  对于Power VM环境,ITM提供了四种不同的监视代理程序,每个监视代理程序均可以彼此独立的运行,一起提供一个完整的PowerVM监控解决方案。

  图2展示了ITM监视代理程序针对Power Systems的完整监控方案

基于Tivoli实现对IBM Power CEC的监控
▲图2. System p Agents监控体系

  2.1 ITM for System p监控代理程序介绍

  ITM CEC Base Agent:

  通过ITM CEC Base Agent可以提供CEC可用性和健康资源监控,显示 CEC 资源和分配到 CEC的各个 LPAR 资源的详细情况。 CEC 监控代理可以监控 LPAR 的数量、每个LPAR的CPU 和内存的分配情况、LPAR利用率、运行环境、CEC 模式和CEC的使用率等。 Agent可以运行在一个单独的AIX或VIOS LPAR上,并且此Agent是被预安装在VIOS系统之中的。

  其它三个监视代理程序的介绍如下:

  AIX Premiun Agent:

  运行在一个AIX LPAR上并提供监控AIX LPAR系统,可以监控AIX可用性、健康状况和性能资源等,如LPAR配置、CPU、内存、存储、网络、打印机、NIM以及WPARS等信息。

  VIOS Premium Agent:

  可提供监控VIOS的可用性和健康状况,如LPAR配置、CPU、内存、存储和网络,还可以显示VIOS服务器和客户端之间的存储和网络映射等。

  HMC Base Agent:

  可以监控HMC的可用性和健康状况,如CPU、内存、存储、网络等。

  2.2 通过ITM CEC Base Agent监控主机所有LPAR的信息

  通过ITM CEC Base Agent可以监控到整个Power Systems的CEC资源,Power Systems通过Power VM实现虚拟化之后,ITM CEC Base Agent则可以监控到具体每个LPAR的CEC资源,如CPU, Memory等详细信息。下文就针对ITM CEC Base Agent的安装与配置进行探讨。

  3. ITM CEC Agent的安装与配置

  本文以IBM Power750平台下的PowerVM虚拟化环境为例来介绍ITM CEC Base Agent的安装及配置步骤。

  3.1 ITM CEC Base Agent的安装

  通常情况下,监视代理程序安装在单独一个AIX或VIOS LPAR上均可。

  AIX: 使用安装包目录下的 install-dir/install.sh 脚本执行安装即可。

  VIOS: CEC Base Agent是被默认预安装在VIOS LPAR上的。

  在安装配置之前,以下的条件必需满足:

  - AIX 5.3 Level 5以上 或 AIX6.1 或 AIX7.1

  - VIOS V2.2.0.0 FP24

  - AIX / VIOS LPAR需要安装OpenSSL和OpenSSH

  根据日常使用经验来看,监视代理程序安装在VIOS LPAR比安装在AIX LPAR效果更好,其主要原因有两点:

  I. VIOS LPAR只作为I/O服务器使用相对AIX LPAR日常维护得更少,减少维护就可以带来更少的停机时间,从而保证监控的连续不中断。另外监视代理程序安装在AIX LPAR上会对PowerVM的动态分区迁移功能产生影响。

  II. 由于ITM CEC Base Agent默认是被集成安装在VIOS V2.2上的,对于ITM管理员而言在一定程度上降低了步署的成本。

  3.2 ITM CEC Base Agent的配置

  下面以ITM CEC Base Agent安装在VIOS LPAR上的配置为例对关键的步骤进行讲解。

  1). 首先进入主机对应的HMC管理控制台,HMC管理地址是https://hmc_ipaddress/,通常一台Power 主机在使用PowerVM虚拟化后会构建多台VIOS服务器,选择其中一台VIOS Server登陆进行配置即可。

基于Tivoli实现对IBM Power CEC的监控
▲图3 HMC管理界面

  2). 在VIOS上配置ITM CEC监视代理程序

  命令的格式如下:

  $ cfgsvc ITM_cec -attr hostname=xxx.xxx.xxx.xxx Restart_On_Reboot=true cec=cecname managing_system=hscroot@xxx.xxx.xxx.xxx

  Agent configuration started...

  Agent configuration completed...

  参数介绍如下:

  ITM_cec: Monitoring Agent的名称

  hostname: 要连接的TEMS的主机名或IP地址

  cec: CEC主机的名称

  managing_system: 对应连接的HMC的主机名或IP地址

  restart-on_reboot: 当主机重启时是否启动Agent

  3). 进入到VIOS的AIX Shell模式以配置CEC监视代理

  $ oem_setup_env

  运行如下命令配置CEC Base Agent:

  # /opt/IBM/ITM/bin/itmcmd config –A pk

  按照向导进行配置即可,其中以下几点是需要注意的:

  TEMS Host Name:

  Agent需要连接的TEMS Server的主机名称或IP地址

  Network Protocol (ip, sna, ip.pipe or ip.spipe)

  ip.pipe ITM组件之间的通讯默认使用的是ip.pipe协议

  IP.PIE Port Number (Default is: 1918)

  缺省的ip.pipe端口号为1918

  4). 登陆主机对应的HMC并进行配置,生成HMC与Agent通信连接的key

  # ssh hscroot@xxx.xxx.xxx.xxx

  使用如下命令开启Agent与HMC之间的SSH通信,并将生成的key复制下来。

  hscroot@HMC:~> viosvrcmd -m managed_system_name -p vios_name -c "cfgsvc -key ITM_cec" ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQC7YaWweIaxtD1na3/DJJ8YaXHR3aPiDkK1/Zi48f1DYd1yx0KwIhHjZGm68yTj0RJM2UyjNLrfVu1Q9t3DdmaIOfrTFz01e1dYWkh7ZgFic4Y6tfK1eyGGMWkw98/FDnQeKRONSM/AugdxCrKcTrOoAGIdpeCmPvCR6ndEQihlAyNFBL/FJWN0zDB91A2baIReGT5qwAlp7HWBPFaciBSRj9vPnmjsBzvbv0ARECj5RDLk4KK29IM5f+6fFN0/SuT+yIimhBCHl/gTz8Z7fDuKvFK0WetLyfliEA38CJMHVoR root@VIOS02

  添加key到HMC密钥库:

  hscroot@HMC:~> mkauthkeys --add

  'ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQC7YaWweIaxtD1na3/DJJ8YaXHR3aPiDkK1/Zi48f1DYd1yx0KwIhHjZGm68yTj0RJM2UyjNLrfVu1Q9t3DdmaIOfrTFz01e1dYWkh7ZgFic4Y6tfK1eyGGMWkw98/FDnQeKRONSM/AugdxCrKcTrOoAGIdpeCmPvCR6ndEQihlAyNFBL/FJWN0zDB91A2baIReGT5qwAlp7HWBPFaciBSRj9vPnmjsBzvbv0ARECj5RDLk4KK29IM5f+6fFN0/SuT+yIimhBCHl/gTz8Z7fDuKvFK0WetLyfliEA38CJMHVoR root@VIOS02'

  5). 登陆VIOS的VIOS Shell模式,使用如下命令启动ITM CEC Agent即可:

  $ startsvc ITM_cec

  Starting Base Monitoring Agent for CEC ...

  Base Monitoring Agent for CEC started

${PageNumber}

  4. ITM对Power System中CEC监控的结果展示

  ITM CEC Base Agent安装配置完成后,用户可以登陆到Tivoli Enterprise Portal Server (TEPS) 查看监视主机的性能相关信息。登陆TEPS可以通过Tivoli Portal Client的方式,也可以使用浏览器的方式登陆查看,其中游览器的访问地址通常为http://teps_hostname:1920///cnp/kdh/lib/cnp.html。

  ITM CEC Base Agent正常运行在VIOS上后,将会尝试连接PowerVM环境下所有的LPAR并收集CEC相关信息,并显示在Tivoli Portal Server界面上,效果如下图如示:

基于Tivoli实现对IBM Power CEC的监控
▲图4 Tivoli Monitoring Workspace展示CEC监控数据图

  下图展示了CEC资源的使用详细以及每个LPAR的CPU、内存分配信息等。

基于Tivoli实现对IBM Power CEC的监控
▲图5 Tivoli Monitoring Workspace展示CEC资源使用信息图

  下图展示了CEC中CPU、Memory资源使用率等详细信息。

基于Tivoli实现对IBM Power CEC的监控
▲图6 Tivoli Monitoring Workspace展示CEC使用率信息图

  并可以在ITM中配置Situation,根据需求预先定义出警告的阀值,监控所有资源,若数值超过非常好的实践阀值,则自动触发警告信息。

基于Tivoli实现对IBM Power CEC的监控
▲图7 Tivoli Monitoring Situation编辑界面

${PageNumber}

  另外还可以配置历史数据收集功能, 将ITM监视代理程序收集来的性能数据写入到数据仓库中,然后根据需求对这些性能数据进行分析处理从而产生业务所需的报表,并可以根据监控数据结果对故障进行诊断。另外收集的历史数据还可以推动性能和容量的规划活动,从而避免由于资源使用过度造成的中断,并可对将来的功能瓶颈进行监控、警报和报告。

基于Tivoli实现对IBM Power CEC的监控
▲图8 Tivoli Monitoring 历史数据收集配置界面

  5. ITM监控经验总结

  本文介绍了如何对企业Power系统进行集中有效的监控,其中重点介绍了使用ITM CEC Base Agent实现Power Systems中CEC部分的监控。在系统使用PowerVM虚拟化后,则可以具体监控到系统中每个LPAR资源的详细使用信息,极大方便了Power Systems的管理工作。

  IBM Tivoli Monitoring Agents for System p针对Power System提供了四种不同的监视代理程序,通过以上对CEC Base Agent的介绍,用户可以自行安装配置其它三种监视代理程序以构成Power Systems的完整监控解决方案。 同时可以配置相应的Situation和历史数据收集,以更好的为企业Power环境起到集中监控的目的。

  主要参考资料

  IBM Tivoli Monitoring官方文档

  https://www.ibm.com/developerworks/wikis/display/tivolidoccentral/Tivoli+Monitoring

  IBM Tivoli Monitoring for Virtual Servers

  http://pic.dhe.ibm.com/infocenter/tivihelp/v15r1/index.jsp?topic=%2Fcom.ibm.itm.doc_6.2.3fp1%2Flanding_sysp.htm

  IBM PowerVM Virtualization Introduction and Configuration

  http://www.redbooks.ibm.com/abstracts/sg247940.html?Open&pdfbookmark

  作者简介:

  张军明

  有IT相关行业数十年以上的工作经验,曾分别任职于国有企业及世界级五百强企业,丰富的IT基础架构经验,中间件部署经验及相关管理经验(如: Interstage, COBOL, Weblogic, WebSphere, Portal),数据库Oracle DBA经验及系统集成经验。

ITM监控经验总结

▲张军明

  目前任职于某大型IT公司,从事于ITM系统环境监控管理、ITM agent安装及部署工作,专注于IBM Tivoli, Power Systems及PowerVM虚拟化平台,在ITM agent部署领域有一定的研究。


  ITM作为监控系统,非常有效的提高了硬件资源的利用率从而节省了相当一部硬件资源的开销,这一优异的表现,在云计算管理上体现尤为显著。
 

  赵志峰

  任职于某外资IT企业,从事系统管理及优化工作。熟悉IBM Power Systems服务器及PowerVM虚拟化技术,熟悉虚拟化环境的部署及维护,具有丰富的系统资源分析及优化经验,专注于IBM Tivoli监控平台管理。

ITM监控经验总结

▲赵志峰

3
相关文章