【IT168信息化】成本费用在增加,资源利用率低下,负载难以预测,业务需求响应缓慢,运营管理日趋复杂,IDC 选择、系统维护和运维管理占用了大量的时间和精力等等,一大堆的问题让企业IT主管头疼不已。
幸运的是,云计算的到来基本上解决了IT部门关注的这些问题。通过按需付费模式,降低了客户基础设施的TCO;通过规模化和自动化为客户提供资源的按需弹性供应、快速指配和部署;通过屏蔽基础设施的复杂性,简化运营管理;客户还可通过问责服务商,得到更高服务品质的保障。
于是IaaS云主机成为一个幸运儿,企业愿意选择,希望通过云主机服务,低成本、灵活实现信息化运营,跳出了“喝牛奶也要买牛”的困局,可以更多的将精力集中在主体业务上。另一方面,企业愿意在IaaS云主机上投资,IaaS云主机供应商如雨后春笋般涌现。
然而IaaS云主机市场鱼龙混杂,有的用户选择的云主机,其实就是一台VPS。如何挑选云主机?除了那些响当当的品牌外,我们应该走进云主机的世界,让真实可信的数据,指导我们的选择。
用户真实应用环境下的性能监测最可信
为了帮助广大用户对市面上提供的主流云服务的性能有更加精准的认识,更理性的选择云主机服务,云智慧与海比研究合作,通过云智慧监控宝部署在全国范围的数百个监测点,真实模拟用户访问行为,对市面上流行的云主机性能从服务器监控、服务监控、网络监控等维度进行全方位检测。
所选择的云主机基础硬件环境均为8核CPU(腾讯、美团、青云为虚拟机CPU),8GB内存,2M带宽,系统为Linux 2.6.32的64位版本。监测覆盖了百度云、美团云、腾讯云、金山云、阿里云、青云、西部数码、首都在线、Ucloud、华为云、天翼云、安畅网络、沃云等国内主流云服务商。
云主机非常态宕机下的用户常态反映
从理论上说,云主机是在一组集群服务器上划分出的多个类似独立主机的部分,集群中的每台机器都有云主机的一个镜像备份。当其中一台机器出现故障时,系统会自动访问其他机器上的备份。所以云主机在数据安全、运行稳定性方面比传统的VPS和服务器更强,而且因为它是虚拟的,费用比独立服务器要便宜得多,所以云主机性价比还是很高的。
然而云主机因为各种原因出现意外故障而死机的现象却时有发生。7月22日,青云用户大会当天,青云北京机房遭到攻击,导致36Kr、GitCafe、SegmentFault等网站和应用无法访问。6月21日,阿里云香港节点出现全线宕机,业务中断超过12小时,甚至有部分用户数据出现损毁,在业界引发轩然大波。
而在国外,云主机宕机事件一样触目惊心。单单2014年8月,全球发生了几起大范围的宕机事件,为这些云服务商带来了巨大损失:AWS先后发生两次宕机,导致其损失700万美元;苹果iCloud宕机致使300万用户受到影响;谷歌全面宕机,5分钟全球流量下降40%。
纵观国内外云主机宕机的情况,宕机的原因可以说是非常态的,是各种各样的客观因素造成的,绝大多数是不可控的。但是对用户的影响却是致命的,损失巨大,即使中断1分钟客户都是难以忍受的,客户无法接受宕机以及其造成的损失却是常态的。
高并发下主机性能实时监测
云主机宕机的元凶主要是由CPU、内存、硬盘在内的服务器基础设施稳定性、可用性方面出现性能瓶颈造成的。远离宕机,除了云主机服务商采用必要保证措施以外,需要对云主机的性能进行客观的评测,让用户对云主机稳定性和可用性有一个准确的认知,这也是云智慧希望能帮到广大用户的。
此次评测中服务器性能监控是指针对服务器系统的运行状态以及各项指标的监控,包括CPU平均使用率、CPU负载、内存平均使用率、磁盘I/O写入平均流量、磁盘I/O读取平均流量等。我们在云主机的初始环境下,部署了一个相同版本的PHP博客应用WordPress,然后在监控宝中选择100个遍布全国各主要省市,使用移动、联通、电信和教育网接入的监控点,以2分钟一次的访问频率,同时向云主机上的WordPress首页发起访问,形成100并发的真实访问压力,在这个压力下测试获得云主机的各项性能指标,监测数据如下表所示。
怎么看这些数据呢?正常的服务器工作状态是CPU使用率在50%-60%之间,内存在50%-70%之间,超过这个极限值,运维人员就需特别关注,且要发出预警。CPU负载就是CPU的工作量,多核CPU能够并行处理的事务的数量应该是个数与核数的乘积,CPU的负载数最好不要超过这个数值。CPU负载太高,即目前工作量已经接近于CPU的最大计算能力了,应该发出预警。而硬盘I/O是云主机性能的最大瓶颈,它不仅会影响高并发时服务器的响应速度,更会对数据库性能的产生影响。当I/O性能大幅降低时,应该及时发出预警,进行必要的干预。
网络质量是影响云服务的最大因素
如果云主机的硬件配置、I/O性能决定了企业应用的可用性,那么云主机的带宽质量无疑是影响网站或应用响应时间的重要因素。网络带宽是指在一个固定的时间内(1秒),能通过的最大位数据。就好象高速公路的车道一样,带宽越大,好比车道越多。网络带宽作为衡量网络使用情况的一个重要指标,也是互联网用户包括云服务用户选择互联网接入服务商的主要因素。
现在网络带宽种类很多,有双线、单线、多线、BGP等。不同的云服务商会提供云主机+带宽不同方案。通常来说,双线、多线、BGP适用于覆盖全国的应用,其中单线是指这个IDC机房要么是联通线路接入,要么是电信线路接入;双线是机房由电信、联通两条线路同时接入的,因为双线有两条线路接入,所以无论是电信还是联通用户都可以快速访问;而采用BGP机房的云服务器能轻松实现单IP多线路,几乎没有跨网瓶颈,也是速度最快的。客户应当根据自己的用户覆盖范围合理选择带宽配置。
诚然,服务器性能、程序架构、带宽质量都会对网站的响应速度产生影响,但从近期频发的云主机事故来看,网络是最容易对云服务造成影响的因素。因此,业内专家一般用网络性能作为评价云主机性能的主要指标。
分布式监测网络评估真实网络性能
通常的网络测试受到条件限制,只能用非常有限的网络接入点和接入方式进行网络质量的检测和评估,得到的数据样本未必准确。云智慧自产品发布之初,就致力于全球分布式监测网络的建设,目前已经部署了200多个监测点,遍布国内各主要省份城市和港台欧美等地区。而这次IaaS云主机网络性能评测选择了国内100个分布在不同运营商、不同地区的监测点,以确保网络监测数据尽量接近真实数据。
此次评测采用的网络评测指标包括:Ping监控,对指定的服务器进行ICMP Ping检测,获得可用率报告以及响应时间、丢包率等数据;Traceroute监控,则通过发送小的数据包到目的地址直到其返回,获得其可用率数据以及响应时间; HTTP监控,是指通过HTTP协议对站点的可用率及响应时间进行监控。
其中,可用率是指网站或者服务器可以正常访问的时间占总时间的百分比,比如网站首页在一天内总是可以正常访问,那么首页这一天的可用率为100%。如果网站首页有9分钟无法访问,而一天共有1440分钟,那么首页的可用率为:((1440 - 9) / 1440) * 100%,也就是99.37%。
响应时间是指从用户对站点或服务器发送请求开始,一直到目标内容下载到用户端,这段时间就是响应时间。对于Ping类型监控,响应时间其实就是我们经常在命令行中用ping命令看到的time值,也就是我们常说的Ping值。
云智慧监控宝分布式监测网络对主流云主机网络性能的评测的数据如下表所示。
虽然在评测周期内数据好得惊人, Ping可用率、Traceroute可用率、HTTP可用率除了个别的云主机外,基本上都达到了100%,但是对不同应用,不同的云主机的响应时间却相差巨大。用户应该根据自己应用的不同和网站评测数据,做出自己的选择。
选择云主机要看性价比
云主机业务在中国开展已经有几年的时间了,云服务商的数量也在不断增加,用户的选择的范围扩大。但有选择其实和没选择,对很多中小企业而言,一样是痛苦的。那么如何理性的选择云主机呢?
首先选择适合自己的硬件配置。不同的云主机服务商提供的硬件配置也不同。通常,云主机的硬件配置按CPU个数、内存和硬盘大小的不同进行合适的搭配。目前来看,云主机硬件按完成任务类型的不同,搭配可分为均衡型、高CPU型、高内存型,以便于客户在不同的场景下使用。而通常的入门级、中端和高端的分类对用户而言没有什么参加价值。
其次,关注云服务商的价格模型。云主机按什么收费?如何收费?一般情况下,云主机服务商采用“服务器+带宽模式” 的基本价格模式,提供不同的收费方案。目前常用的收费模式分为:按时计费、按月计费、按年计费以及按流量计费等不同的计费方式,同时一些服务商还提供按需后付费的模式。
第三,比较不同服务商价格策略。稳定、透明以及公正、灵活的价格体系最能给客户带来安全感,稳定的价格体系,能够从本质上保护客户的利益,使客户的成本和花费可预期、可控制。因此,在选择是不能忽视云主机服务商上的价格策略。
第四,比较云主机的性能指标。 虽然所有的云服务商都声称其服务可用率超过99.9%,但是由于国内网络环境的复杂性,以及服务商软、硬件实力的差异,造成用户在相同硬件、系统和网络资源配置下,获得的IaaS服务质量存在差异。因此,用户在选择云主机产品时,应该坚持数据优先,综合考虑。
目前,衡量云主机的性能指标主要包括主机的性能、存储I/O带宽以及网络性能三大类,每一类都有很多依照业界标准推出的测试环境和测试指标,可以客观地反映云主机的实际性能。
最后,考虑云主机的性价比。毋庸置疑,单纯比性能和配置或者单纯考虑价格是不够的,性价比无疑成了用户选择的重要标准。需要注意的是:并不是价格越低越好,而是看同样的配置和性能保证在不同的服务商那里需要花多少钱;要考察整体价格,不能使起步价格和部分价格;要以真实用户体验数据为标准,如云智慧采用监控宝得到的监测结果就真实可靠,值得用户信赖。