信息化 频道

云计算SLA:如何保障企业正常服务时间

  【IT168 信息化】

  当前,考虑到云计算和大型主机时代之间的相似性(对远程资源的高度依赖),云计算服务级别协议(SLA)已经势在必行。

  在经历了22年前伊利诺斯州贝尔公司转接站的那场大火之后,Raymond Gloor很自然地成为了一名数据安全专家。当时的火灾导致了数十万人通讯的中断,损坏了该州Hinsdale与其他50个转接中心的光纤通路。“我们从未遇到过一个站点的损坏就导致了这么严重的后果。”Gloor回忆说。下面这段话节选自1988年5月Hinsdale那场大火之后纽约时报的评论文章:

  由于线路不仅承载话音还负责传输计算机数据,其对国民经济的重要性日益凸显,所以电话系统的脆弱性是一个急需解决的问题。企业日常都用电话线路传输订单、资金和相关信息。电话服务的故障将会极大影响经济的运转,从而导致数以百万计美元的商业损失。

  “把这篇文章的标题改成《万维网》,同样的内容也一样适用。”Gloor说。而且现在网络上有大量的视频内容,这将会导致反应速度的变慢。而对于某些行业来说,这种延迟是令人无法接受的。

  “你不能对银行客户说‘我们不知道你的户头上有多少钱’。”Gloor描述说。由于政府关于银行业新法规的出台,如何应对延迟问题变得非常重要。“这不是一只800磅的猩猩。”他说:“这只猩猩是怪兽级别的。”

  伊利诺斯转接站的教训极其深刻,也同时决定了Gloor对于云服务提供商的立场:“业务连续性是如此重要,尤其是对于那些考虑把应用移入云端的CIO们来说更是如此。Web连接发生故障的后果是什么?如何通过云SLA来解决这种问题?”

  Ken Harris是Shaklee Corp.(位于加州)的CIO,而且也是Gap Inc.、耐克公司和百事公司的前任CIO。他同意Gloor的观点:“作为CIO,我有责任确保所负责的系统可用性在99.999%以上。但是坦率地说,以我对SaaS的切身体验而言,很多云提供商没有真正认识到这一点。”

  灾难规划人员认为所有能想象到的事情都会在某个时间点发生。在云服务故障时应该怎么做呢?Harris认为很关键的一点就是用云SLA来确保正常服务时间、响应时间以及系统的及时恢复。

  云计算SLA保障正常服务时间

  除去各种不可抗力的因素,Harris认为真正危险的是SaaS服务提供商没有理解CIO们对于正常服务时间的需求:“一个坏损的、无法发挥作用的系统对我们来说是不可接受的。”

  Harris就这些相关问题和PivotLink公司(位于加州旧金山的一家按需商业智能服务提供商)进行了直接沟通。Harris的雇主Shaklee是一家天然营养品公司,其每年都要进行数百项的科学研究,从而会产生大量的数据。在正式购买PivotLink的服务之前,Harris先确认了该公司满足下列要求:

  响应时间。“我必须对响应时间负责,必须达到要求,否则无法合作。”Shaklee公司通过一些简单的交易事务测试了PivotLink服务的响应时间。

  故障时间。如果系统故障,提供商应该通过自身力量确保服务恢复。

  灾难恢复。仔细核查合同中的相关内容。你应该有一个容灾的恢复站点,可以是企业本地的。

  正常服务时间的奖励。Shaklee为PivotLink提供了针对正常服务时间的经济激励。“这在每份SaaS的合同中都应该有所体现。”Harris表示。

  总之,通过互联网提供的服务难免遇到故障,但是这并不意味着就束手无策了,CIO们可以和云提供商进行协商以应对最坏情况的发生 – 而且,要以书面形式加以规定。

0
相关文章