信息化 频道

淘宝网宁海元:善用DBA的千里眼和顺风耳

【IT168 专稿】    4月2日,中国首届数据库技术大会在北京盛大召开。在这一面向数据库及商业智能技术专业人群的技术盛会上,各路DBA高手云集,悉数分享各自在数据库技术领域深入研究的体会和经验。不论是演讲人还是听会人都抱着分享、学习、进步的愿望,充分互动与交流。

    DTCC大会第二天,数据库分析监控与运维分析专场人头攒动,并没有因清明小长假的到来而影响大家学习的热情。正在台上演讲的是淘宝网数据库技术专家、产品DBA技术经理宁海元(网名:NinGoo),基于七年Oracle/MySQL DBA的经验总结,他在讲解如何通过构建高可用数据库监控系统来全方位对数据库进行自动化监控。

    对于一个大型分布式、高可用的数据库系统来说,一个全面、精确、自动化的监控系统就是DBA的千里眼和顺风耳,必不可少。每天DBA都将面临这些问题:

    如何面对重复工作:每天都在机械地做着相同的工作;

    如何实时监控:无法实时知道数据库的运行情况;

    故障如何重演:往往故障后再登入系统问题却已不存在;

    何时才不当事后英雄:总是故障发生后才想办法解决;

    精准扩展评估:不再拍脑袋决定数据库扩展性。

    对于数据库的监控,可以分成两种类型,一种是实时的错误告警,需要尽快将一些错误信息发送给相关责任人,这里更多的是属于救火的性质。另外一种则是关键指标历史趋势的展示和自动分析,帮助DBA更早、更快地发现数据库指标的异常波动,提前发现、处理和预防问题。

    淘宝网通过结合两种监控手段的优点,打造了一个轻量级、可伸缩、自动化的监控告警与分析展示系统,为7*24的高可用数据库系统提供安全可靠的保驾护航。该数据库监控平台通过提供如下功能来解决DBA每天面对的问题:

    · 7*24全方位的数据库监控

    · 性能数据及时抓取及存储

    · 异常触发及时预警

    · SQL多角度分析及跟踪

    · 表空间的使用情况跟踪

    · 段空间的使用情况跟踪

    · 表的DML情况跟踪

    · 序列的使用情况进行跟踪

    · 活动会话等待情况跟踪

    最后,宁海元给出DBA们开出良方:

    重复工作:可以由程序代替部分人力劳动

    实时监控:可以通过对数据库实时扫描实现

    历史重演:周期记录重要的历史信息

    事后英雄:充分了解数据库情况,防患于未然

    扩展评估:根据监控数据尽心决策

    中国首届数据库技术大会由IT168网站携手旗下三大企业级社区ITPUB、ChinaUnix、IXPUB社区举办。本次大会是首个面向数据库及商业智能技术专业人群的技术盛会,全部议题围绕使用的技术性主题,从数据库的架构设计、性能优化、存储安全、系统监控等方面,通过实践案例对数据库技术进行系统剖析。

0
相关文章