信息化 频道

未雨绸缪 历数云计算部署失败十大原因

【IT168 评论】  每一个云计算供应商,从谷歌到Rackspace,从亚马逊到Salesforce.com,都曾经遇到过断电的困扰。当这些断电情况突发时,怀疑论者们就开始质疑云计算的可行性。

  与任何一个乐于投资于云的人谈谈吧,你不需要花太长时间就能理解这些断电事件仅仅是云事业中的一项成本而已。可是,那又如何?

  断电现象几乎会发生在我们所消费的每一项服务中。今天,即便iPhone 4有着惊人的掉话率,苹果公司仍在享受着创记录的利润。然而,那些质疑智能手机或者iPhone还有Apple的可行性的言论又在哪儿呢?

  这些发生在数据中心里的断电事件随处可见。那些质疑内部IT部门可行性的言论呢?你上一次断电时什么时候?你是否质疑过国家电网的可行性?

  你可以采取很多措施来应对断电情况的发生——使用备用发电机(在云环境下,备份数据),但是这些措施并不能解决根本问题。停电是服务商的问题,而不是你的问题。

  与其它常见的故障一样,用户在决定成功或者失败的时候扮演着更为积极的角色。以下列举出一些企业们引进云计算的时候出现的最常见的错误。

  1. 期望值不切实际

  很多公司都视云计算为今天包治百病的良药。底线存在问题?引进云。难以保证远程员工的生产性?相信云。是否越来越多的员工在家里工作?也许云可以帮忙。

  “制定不切实际的期望值是企业出现云计算问题的头号原因,”ISACA(国际信息系统审计与控制协会)副主席Robert Stroud说。

  “很多企业都认为他们只需要向云供应商提出自己的要求,然后,一切就将像童话故事里一般自己完美地运作。”

  如果那是你在家里设置了一个新的应用程序,你还会那样天真么?如果你没有制定具体实际的目标,那么,当云计算辜负了你的期望的时候千万不要感到惊讶。

  2. 落后的计算概念

  今年年初,Heroku因为亚马逊EC2的断电而彻底傻了眼。Heroku为Ruby on Rail提供了亚马逊托管的云部署平台。当天气因素导致断电,Heroku亲眼目睹了它的整个架构伴随着平台上四万多个应用程序在一瞬间灰飞烟灭的过程。

  事实上该公司早就为排除故障和冗余做了自己所能想到的一切。但是他们没有意识到的是,自己把所有的一切都托管给了一个单一的亚马逊“可用区域”。

  事后,亚马逊与Heroku通力合作,很快就追回了他们的平台,但是通过这次事故却可以看出计算理念的落后可能破坏云计算所作出的努力。故障转移、备份、和信息冗余比较容易在计算世界中进行虚拟化。如果你对现场进行了备份,那么你就能一直保持良好的状态。

  “云计算中的稳定性是复杂的,这是我们吸取的教训之一,”Heroku的首席执行官Byron Sebastian说,“云架构是一个完整的解决方案,这是一个云计算的谎言。就像任何其它IT系统一样,在云中你同样需要附加软件。”

  因此,为了给用户提供诸如先进的故障转移、负载平衡和信息冗余等服务,Heroku扩大了自己的平台,所有的一切都为云托管的应用程序量身定制。

  3. 不能坚持让服务供应商负责

  Heroku是幸运的。在他们面对困难的时候,亚马逊及时向他们伸出了援助之手。其他人可能就没有这么幸运了。浏览一下主要的云计算平台用户论坛,你就会发现大量不满的宣泄。

  “某某厂商丢失了我所有的数据但是却对此置之不理!”像这样的抱怨不计其数。(这种抱怨的言论后面通常添加了很多感叹号。)当然其中不乏一些自己把事情搞砸了却想找人发泄不满的人,也有一些心理不平衡的疯子,但是确实有不少合理的抱怨。

  有些人屏蔽了关于其他用户对于服务厂商的抱怨记录,我与这些人中的很多人谈过,但是很少有人会对这些由用户服务所产生的争论进行讨论。

  Novell的商业服务管理解决方案市场部经理Michele Hudnall给我发邮件的时候强调了清晰定义服务水平协议(SLA)的重要性。Hudnall提醒说,必须小心缺乏服务水平协议、模糊定义服务水平协议和那些整体服务管理不佳的情况。

  在关键业务出现问题的时候,哪怕只是在很短的时间内,企业就可能失去1%到2%的收入。当发生这种情况的时候,坚持要求服务供应商负起责任非常重要。这可能意味着需要就你的合同和服务水平协议中的赔偿条款和补救措施进行重新谈判。

  Gartner最近起草了一份云供应商应该履行的消费者权益清单。其中包括服务水平协议中解决负债、补救措施、业务指标等条款;影响用户业务流程的服务项目的改变的告知权;了解系统技术限制的权利等等。

0
相关文章