信息化 频道

淘宝首席DBA楼方鑫实战数据库性能诊断

【IT168 专稿】    4月2日,中国首届数据库技术大会在北京盛大召开。在这一面向数据库及商业智能技术专业人群的技术盛会上,各路DBA高手云集,悉数分享各自在数据库技术领域深入研究的体会和经验。不论是演讲人还是听会人都抱着分享、学习、进步的愿望,充分互动与交流。

    两天的DTCC大会覆盖数据库的架构设计、性能优化、存储安全和系统监控等七大主题。在第二天下午的数据库分析监控与运维分析专场上,淘宝网首席DBA楼方鑫为我们带来Oracle性能数据分析。DBA们多面临过这样的困惑:目前系统是否稳定?是否有未知隐患正在某个不远的前方等着呢?业务如果增长一倍,如何才能保障数据库性能?数据库系统因为其通用性差,资料缺乏,加上数据系统本身作为公司核心资源的机密性,其性能诊断分析任务便难上加难地成为DBA肩上的重担。

淘宝网首席DBA楼方鑫激情演讲

    楼方鑫认为:Oracle性能数据分析DBA的工作中与性能有关的工作不仅仅是简单的SQL性能调优,还有系统监控及容量规划。面对日益增多的数据库系统,和日渐复杂的应用系统, 仅靠Statspack或AWR的报告,会让DBA越来越累。这就需要DBA能够直接分析Statspack或AWR积累的大量底层Oracle性能数据,以此建立系统性能有关的报警,并做出容量分析报告,提前采取措施,提升数据库系统的处理能力。

    DBA对Oracle性能数据的分析需基于长期保存的实时数据,这些实时数据包括每10秒钟操作系统+Oracle的实时性能数据,以及每3/5分钟交易、充值或信息等实时的业务数据。分析工具则包括WebChart(可以是网页的表格或图形等)、Excel和SQL Query等。不可忽视的还包括关联因素,包括操作系统性能关联、Oracle性能数据关联、与业务数据的关联和系统变更间的关联。

    除此之外,楼方鑫还介绍了分析系统是否稳定主要指标,包括活动会话、锁等待、平均负载和时间轴,以及如CPU利用率、Swap in/out、执行次数、逻辑读写、事务数、日志生成量等辅助指标。DBA在面对数据库问题诊断的过程中首先要注意识别变化,有些指标需要关注其实时变化,比如活动会话和CPU利用率等;有些指标则是缓慢变化的,需要关注其长期变化,如下图。

    在问题诊断过程中另一需要引起DBA注意的则是关联分析,比如,当事务指标瞬间下跌时,可以看是否两个数据库是同时下跌,如果是则要怀疑是否存储出现问题?而如果这两个数据库所用存储不是同一个就要怀疑是否其他方面出现问题。而在如类似超值红包、淘宝秒杀等运营活动同样可以通过稳定性边界、CPU处理能力、IO时延、事务数和日志量等因素对容量进行评估。

    中国首届数据库技术大会由IT168网站携手旗下三大企业级社区ITPUB、ChinaUnix、IXPUB社区举办。本次大会是首个面向数据库及商业智能技术专业人群的技术盛会,全部议题围绕使用的技术性主题,从数据库的架构设计、性能优化、存储安全、系统监控等方面,通过实践案例对数据库技术进行系统剖析。
 

0
相关文章