编者按:微软公司是超级计算领域的后知后觉者。改变这一现状就要击败Linux并招募新人。
生命中最有用的教训有时总结自很久以前的经验。当比尔·盖茨(Bill Gates)不久前回忆30年前中断哈佛计算机课程的往事时,情况也许就是如此。“我那时上生理心理学和经济学,”这位学校里最著名的本科生回忆道,“如果你看见我的课程签到簿,你会认为我根本不是一个软件编程人员。” 现在,就像它的创始人当年那样,微软公司正在走上一条多学科交叉的道路。
切入超算市场
计算、科学和教育领域所发生的巨变,促使微软公司将未来发展的眼光放在了个人和商业计算市场之外更广阔的领域。其中最重要的一个就是超级计算机市场,这是视窗(Windows)操作系统至今尚未染指的市场。盖茨预测,目前,有越来越多的小公司正在采用这种超级计算服务器集群,这将会成为商业计算的基础,并加速科学、医疗、产品设计和金融领域下一次突破的到来。
为了顺利挤进这个市场,微软公司需要更好的产品来抵抗地位稳固的Linux操作系统。而对它来说,比较困难的是它迫切需要一些新的复合型人才。比如像基因和纳米技术这些新兴领域,越来越和软件技术的发展融合在一起,这就意味着目前大部分主修生物、物理或者化学等学科,并懂得一定计算机技能的毕业生,是微软公司最为需要的人才,不过,在这些专业领域内,微软公司并非是很有吸引力的企业。这些现实迫使盖茨尝试多学科交叉的道路。
在“SC05超级计算大会”的主题演讲以及其后在西雅图的专访当中,盖茨展示了公司进入科学计算市场的计划。微软公司会发布一个特别版本的视窗;启动一项价值达数百万美元的扩展计划,以利用位于美国、德国、中国和其他国家10所大学内处理器的高性能计算能力;提高它600多名研究人员与艾滋病研究、天文学和海洋学等领域科学家的协作水平。如果科学计算的应用扩展到航空、汽车工程、制药、医疗图像,甚至是消费品设计,影响很有可能是非常深远的。
微软公司不久前发布了新版本视窗的第二个公测版本,这个视窗系统是为科学计算设计的,预计2006年上半年正式发布。微软公司声称它的定价会低于视窗服务器2003的企业版本(大客户版本标价800美元)。微软公司也在为它的图形化开发工具设计新的功能,它可以帮助科学家编写集群的程序。
使用集群技术,用户可以把成百上千台廉价的PC服务器用特殊的连接方式连接起来,运行的软件可以在处理器之间分配工作。这种方法让大学、超级计算中心和企业IT部门付出比专用架构低得多的成本享用超级计算的能力。但是,由于许多超级计算行业人士很早就开始使用共享版的Unix,所以,迄今为止,集群系统已经由Linux主导。同样,他们对视窗系统也不会特别青睐。“同时喜欢视窗系统和Linux的人很少。”联合技术公司(United Technologies Corp.)旗下普惠公司(Pratt & Whitney)高密度计算副研究员皮特·布拉德利(Pete Bradley)表示。
这家商业和军用飞机引擎制造商,也是超级计算的长期用户。但是他们员工的高性能计算专业知识很多还是基于Linux的。 “微软公司发现,这个快速成长的领域几乎被Linux完全占据,”布拉德利说,“因为集群计算正在变成主流技术,显然微软公司很希望在这个领域大显身手。”
“滴入”式计算
根据国际数据公司(IDC)的数据,科学计算系统的销售去年增长超过了30%,达到了725亿美元—超过了个人与商业计算的收入增长速度。集群系统的销售增长甚至高达96%。技术系统占据了全世界所有服务器市场的16%。
微软公司也断言,集群计算这个市场还会进一步增长,更多的企业研发部门正在借助于一些高校实验室开发的高性能计算技术,广泛地运用在企业产品设计和开发上。
通过切入世界高性能计算领域,微软公司将自己和它的客户定义在这样一个时代:现有高端系统拥有的计算能力将在工作组甚至桌面上应用非常普及的时代。这是一个问题同时也是一个机遇。由于芯片设计师在设计更快速的微处理器的时候,遇到了物理极限,AMD公司、国际商业机器公司(IBM)、英特尔公司(Intel)和太阳计算机系统公司(Sun)的工程师们,正在将2个或4个处理器封装在一个芯片上,以此来提高其性能。
但是这样做使得利用这些芯片的设计来进行软件编程变得更加困难。当业界在2012年走向单芯片64处理核心、2015年走向单芯片上百个处理核心时,这个问题只会变得更加糟糕。为了提高产品设计,以防上述情况的发生,微软公司就会特别需要超级计算的知识;那些超算研究人员数十年来一直在多个芯片上分配算法。
“这里有个滴入式(Trickle-Down)效应。”田纳西大学(University of Tennessee)和美国橡树岭国家实验室(Oak Ridge National Laboratory)计算机科学教授杰克·冬加拉(Jack Dongarra)这样表示,“那些今天我们认为是超级计算的能力,最终还会下渗到商业和家用机器中去。对微软公司来说,高性能计算市场就像是一个孵化器,它能够把许多创新的想法变成主流的技术或产品。”
新型人才
为了加速这个孵化过程,微软公司资助了10家高性能计算的研究机构,每家获得几十万美元的资金,其中有田纳西大学、犹他大学、弗吉尼亚大学、华盛顿大学和康奈尔大学;德国的斯图加特大学;以及中国的上海交通大学。作为交换条件,那些大学里的教授会提供给微软公司设计方面的帮助和对其产品的反馈。得到受人尊敬的业界名人的加盟可以提升微软公司在多疑的超级计算用户之中的可信度。
微软公司也在企业内部增加超级计算领域的人才。微软公司在2005年6月聘任了前英国“科学计算”项目总监兼英国皇家工程院(Britain's Royal Academy of Engineering)院士托尼·海(Tony Hey),任命为技术计算的副总裁。去年11月,欧洲粒子物理研究所(CERN)前顶尖的技术经理法布利希奥·加格利亚迪(Fabrizio Gagliardi)加入微软公司。微软公司内部拥有高端计算经验的老员工,包括公司高级副总裁兼高级战略与政策首席技术官(CTO)克雷格·蒙迪(Craig Mundie),他曾经在上个世纪70年代效力于通用数据公司(Data General)并在1982年创立了超级计算机公司爱林特计算机系统公司(Alliant Computer Systems,下称“爱林特公司”);戈登·贝尔(Gordon Bell),前数字设备公司(Digital Equipment Corp.)高管,负责开发PDP和VAX小型机;以及研究员吉姆·格雷(Jim Gray),代表计算领域最高成就的图灵奖(Turing Award)获得者。
但明星阵容也暴露了一个明显的弱点:微软公司只对计算机人才有吸引力。它需要跟计算机以外学科的科学家走得更近,因为蒙迪和盖茨要用更多的人才面对科学、医药和工程领域复杂的社会问题。“微软公司需要的唯一原材料就是高智商的人才。”蒙迪说,“他们来自生活的各个方面,不仅仅是计算机科学。微软公司的研发部门仍旧拥有过多的计算机科学出身的人员。”
微软公司传统的做法是通过提供计算机科学教授研究基金的方式资助高校的研究。这种做法有助于吸引研究生加入研究项目而且成为微软公司潜在的员工。现在蒙迪希望将公司的资源投向有助于项目的更广阔领域。高性能数据库的作者格雷与天文学家合作多年,把他们的望远镜观察的数据库用Web服务虚拟连接到一个可以查找1亿天体的在线数据仓库。另一位微软公司的研究人员物理学家大卫·海克曼(David Heckerman)最近将微软公司开发的机器学习和数据虚拟化技术用于华盛顿大学的艾滋病研究。
物理、化学和生物学科的优秀毕业生有望成为熟练的计算机编程人员,但是蒙迪说,微软公司还不太能够吸引他们。因为新型的合作可以网罗更大范围的“知识精英”,他说:“我们必须从更宽的角度看待知识渊博的人。”
更小的安装
在性能最强的系统中,几乎难觅微软公司的踪影。根据不久前田纳西大学的冬加拉和其他教授列出的世界500个最快计算机排名500强名单,只有康奈尔大学的一个系统(微软公司重金资助它使用微软公司的产品)是运行了视窗系统。要改变这个现状还需要好几年的努力。必须承认500强所处的市场比微软公司的视窗计算集群(Windows Compute Cluster)所针对的市场更高端,不过,更多的系统进入500强可以增加企业声誉。
现在微软公司瞄准了小规模的高性能市场—小于200个机器的集群。这部分市场增长最快而且利润最高。“微软公司从战略高度跟进这个高利润的细分市场。”橡树岭国家实验室首席信息官(CIO)斯科特·斯塔汉姆(Scott Studham)说。
集群版本视窗的部分吸引力,是它能够在台式机或者笔记本上快速开发一个数学模型,然后在高性能集群上模拟运行而无需改写代码。默克公司(Merck&Co.)正在20台运行Matlab程序的机器上测试视窗计算集群操作系统,这是Mathworks公司开发的,应用十分广泛。高级遗传科学总监埃里克·夏特(Eric Schadt)表示,药品开发行业的高速增长使得软件开发周期越来越短。“生物学领域正处在知识爆炸时期,”夏特表示,“我们在不断开发新的算法。当我们发现某个算法已经可以应用,我们就不想再等上6个月让原型程序运行到Linux上。我们希望从原型程序直接运行到高性能计算环境。”
微软公司正在通过在新版本的视窗里加入Point-and-Click管理工具,来提高系统易用性,这个工具可以让生物学家配置一个集群和一个流行的MPI集群中间件版本,后者是由微软公司和阿贡国家实验室(Argonne National Laboratory)一起开发。其他开发中的产品有针对科学家的可视化开发环境,和用来做科学会议记录或将Excel计算发送到远程系统的Office 应用程序扩展。“我们能够让这项技术造福于更多的人,”蒙迪这样声称,“现在,市场上的这些技术还不是那么易用。”
在西雅图大会上,微软公司演示了一个由4台机器组成的“个人集群”原型,达到25Gflops的性能(相当于10台PC的性能),并声称,这台设备占有空间很小,普通的桌子下面就能放得下,而售价则低于1万美元。
这些趋势将会把行业引向何方?可能在10年甚至2年后用户就会拥有无法想象的计算能力。而现在的集群所能做的工作在15年后可能仅一个芯片就能运行。这些进展可能会带来更简单的与技术互动的方式。计算性能的指数型增长,将会给我们的日常生活带来计算机的视觉和语音界面,或者更加智能化的桌面信息过滤。
除非微软公司对新型人才的巨大需求能够得到满足,并储备后续的人才库,否则它很难做到这点。盖茨表示:“我们越能够理解软件来推进科学发展,也就意味着人才的短缺会日益突出。”
(信息周刊)