信息化 频道

集群文件系统 改变企业存储方式

  集群计算机在科学和商业领域正变得日益重要。在2004年11月田纳西大学(University of Tennessee)和德国曼海姆大学(the University of Mannheim)公布的全球500台速度最快的超级计算机名单当中,有296个系统是集群计算机。存储也获得了业界更多的关注,因为旨在防止诈骗的新出台的联邦法规,也正刺激企业保留更多的数据。2005年,太阳计算机系统公司(Sun)投资41亿美元现金收购ST公司(Storage Technology Corp.)的举措,就是为了顺应这个潮流。如果高校、国家实验室以及少数比较大胆的企业能够更加广泛地采用Lustre和其他类似技术的话,就很有可能会改变目前企业普遍流行的存储采购方式。
  
  “Lustre技术已经吸引了大量的眼球。”集群专用网络设备制造商Myricom公司的首席执行官(CEO)兼首席技术官(CTO)楚克 ·赛茨(Chuck Seitz)表示。凭借这项技术所带来的速度和低成本优势,Myricom公司的产品在一些国家实验室获得了一席之地,比如劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)、西北太平洋国家实验室(Pacific Northwest National Laboratory)以及美国超级计算应用国家中心(NCSA)等。
  
  NCSA在被称为“Tungsten”的集群上运行Lustre,它拥有1,240节点、9.8Tflops浮点运算能力,主要用来运行气象科学、航天以及其他应用程序。NCSA存储技术项目经理米歇尔·巴特勒(Michelle Butler)解释说:“你肯定不愿看到一台价值800万美元的机器在那里等待数据I/O。”等待时间的减少也意味着那些拿了国家科学基金会津贴(National Science Foundation)的科学家们,可以花费更少的计算时间来从事自己的研究。“5~10年前的应用程序,由于等待时间太长,因此没有一个做I/O处理。”她说,“现在的数据铺天盖地。”
  
  由于国家科学基金会的项目数据也运行在NCSA的计算机上,因此NCSA的存档服务器每月要增加40~60TB的数据。就在上世纪90年代末,计算机科学家还在研究怎样在程序里利用内存,以避免向磁盘读写数据。“现在不用再教他们这些东西了。”巴特勒说,“计算机科学家的习惯已经发生了很大改变。”
  
  传统上,也有好几种方法能够扩大存储的规模。高度标准化的网络附加存储系统(NAS)使用通用的协议可以在局域网(LAN)上共享文件,比如微软公司的CIFS系统,或者基于Unix和Linux的标准的网络文件系统(Network File System)都是如此。用户通过这些系统可以将很多电脑连上同一台服务器,共享存在于网络里的虚拟磁盘。NAS使用廉价的以太网连接各台计算机,但它传输数据的速度只有1GB,比多数应用程序运行速度都要低。由于它与本地磁盘交换数据的速度相对快于网络通信的速度,结果就造成阻塞现象。
  
  存储区域网络(SAN)传输速度超过了NAS,最高可达2~4GB,但需要昂贵的光纤通道交换机提供支持,而且每台计算机还要配备一块价值1,000美元的板卡。此外,iSCSI协议在共享存储网络中日益普及,它允许SAN内部磁盘和计算机之间直接通过以太网通信。
0
相关文章