下一轮脑电波-信息化专区

下一轮脑电波

作者：Aaron Ricadela 编辑：袁晓怡 2007-06-01 01:36

编者按：有关人工智能的最新研究，将为计算机学习人类和周围的世界打下一定的基础。

　　在计算机工业发展之初，人工智能就曾使得无数社会科学家和高科技研究者为之痴迷，但是，从上世纪90年代开始，它却渐渐失去了诱人的魅力。经过上世纪80年代的投机性繁荣之后，科学家们试图将人类智能编成代码转化到系统中，使系统能对概念进行分类，并且系统之间也能相互联接，但是，这些努力并没有获得成功。而且那些所谓的“专家系统”，体现出来的往往是人类社会中某些权威所认同的规则和智慧的结晶，而这些专业而精深的规则和思想，除了应用于专门的编程项目以外，很难普及和推广到大众领域。即使当年国际商业机器公司（IBM）的国际象棋机器人“深蓝”（Deep Blue）凭借每秒判断2亿个棋盘位置的本领，击败了国际象棋大师加里·卡斯帕罗夫(Gary Kasparov)，这一胜利仍然没能带来人工智能产业的全面复苏。

　　如今，新一代的研究者们希望能够重新激发起人们对人工智能的兴趣。一方面，更快、成本更低的计算机处理能力、内存和存储，以及能够对演说、笔迹和文章结构进行分析的统计技术的兴起，都有助于刺激人工智能领域新的发展；另一方面，用户们已经转变思路，他们不会等到人工智能技术完全成熟再使用这个技术，而是希望获得实用的解决方案来解决日常问题。目前，研究人员正在开发带有人工智能功能的用户界面，系统能进行运算或根据用户需要的预期来提示一些文本信息，同时，软件试图反映出人类的记忆，以帮助他们在杂乱的数字世界中找到有用的信息。很多研究都采用了“贝叶斯统计方法”(Bayesian Statistics)。“贝叶斯统计方法”是数学的一个分支，它在做统计时，既能考虑到人们一些共同的经验和认识，而且还能从截然不同的历史知识中把一些不完备的和偶然结果也考虑在内。一些新的人工智能研究还涉及到计算机科学的一个新生领域：人工智能与人机互动之间的交叉领域。

　　一些行业趋势也促进了人工智能的研究。新兴的无线传感器网络领域，应用人工智能技术可以帮助进行数据分析。无线传感技术在收集行业运营、生态系统或建筑物及家庭状况等方面的海量数据上，也有着很大的潜能。美国国防部也在继续资助人工智能的研究，部分原因是为制造智能汽车和机器人打下基础；今年10月，国防部先进技术研究计划署（Defense Advanced Research Projects Agency）将在加州或内华达州的沙漠中，举行第二届“大挑战”机器人汽车大赛。

　　奔迈公司（Palm Computing and Handspring ）的创始人和Palm Pilot的发明者杰夫·霍金斯（Jeff Hawkins）和堂娜·杜宾斯基（Donna Dubinsky）同样对人工智能表现出了强烈的兴趣。今年3月，他们创建了Numenta公司，主要从事模仿人类大脑记忆的软件产品的开发工作。该公司的模拟软件能完成普通计算机无法做到的事情，比如说，区分动物的图画等。

　　《信息周刊》英文版分别考察了4个人工智能研究实验室，他们分别是IBM公司，英特尔公司（Intel），微软公司（Microsoft）以及施乐公司（Xerox）下属的帕洛阿图研究中心（Palo Alto Research Center）。尽管目前的研究或许并不会带来人工智能的新一轮大发展，但它将为一系列新的计算机系统打下基础，这种计算机系统将具有从用户和周围世界学习的能力。

IBM公司：点燃神经元

　　上个世纪80年代末，当人们对传统人工智能的热情开始消退时，人工神经网络的开发引起了人们的关注。神经网络不再是利用关于生活中各种概念的符号之间的联系来运算，而是根据代表问题和潜在答案的列表进行运算。这些人工神经元能根据一整套训练解决方案，学习各种关系，并最终形成“层叠”结构。于是，一个神经元系统的输出将变成了另一个系统的输入。IBM公司位于纽约州约克城高地（Yorktown Heights）沃森实验室(Watson Laboratory)的研究人员正在根据脊椎动物神经系统的生物特征进行研究和设计，构建“层叠”的神经元网络，以期使这个模型变得更加精致和复杂。

　　这项为期4年被称为“系统神经元运算”的项目具有深远的意义。IBM公司将这一项目的资助类别归到了“风险研究”类别之下。查尔斯·佩克（Charles Peck）是神经元运算研究的项目总监，他拥有神经元科学、数学和人工智能方面的背景，而研究员詹姆斯·科兹洛斯基（James Kozloski）是毕业于宾夕法尼亚大学（University of Pennsylvania）神经元科学系的博士，他在中心从事非洲淡水鱼神经系统的研究。

　　系统神经元运算旨在解决人工智能方面的一个难题：在写程序之前，就必须预先判断每项任务可能遇到的所有新问题，但要写出这样的程序，几乎是不可能完成的任务。普通的编程语言，如C语言，它的工作原理是编好指令，计算机必须根据这些指令来操作。但是当遇到一项任务，如阅读新文章时，它就无法发挥作用了—因为它没办法预先知道故事的单词将是什么，或者他们将以什么样的顺序出现，程序员自然也无法为此编写程序。“计算机科学的发展碰到了一大障碍。”佩克表示，“那些我们能把各方面因素都考虑到的东西，毕竟是少数，而我们日常所碰到的各种各样的偶然或突发的问题要多得多。这样，我们就没办法为此预先编写程序来解决这些问题。任何技术，当它要求你预先知晓未来发生的一切时，注定没有好结果。”到目前为止，研究员们已经编写了两个内部编程语言，来检测多层神经元网络如何能避开这个问题。

　　科兹洛斯基称，他和其他研究人员在今年3月公开发表了一篇论文。文章表示，他们能够识别模式，并避免一个被称为“叠加灾难” （Superposition Catastrophe）的问题。该问题是神经元网络所面临的一个重大障碍，即系统会误认为，两处不同来源的信息是来自同一个地方，或者系统会误将两个来源的信息进行折中考虑。（比如，神经元群A表达特征A，神经元群B表示特征B，当A与B重叠起来表达特征C时，A与B就消失了，这就是“叠加灾难”）。接下来将有一个论证，以数字化形式模拟人类的推理能力，比如看到虚线（Broken Line），就可以推断出完整的实线。这将是对如何建造看得见的计算机的一种先验的了解，科兹洛斯基补充说道。

英特尔公司：电脑愿景

　　两年前，英特尔公司开发了一个计算机愿景系统模型（Prototype Computer Vision System），它能通过解读用户的唇语，来提高语音识别软件的准确性。但是，英特尔公司机器学习小组经理加里·布拉德斯基（Gary Bradski）却表示：这是个有着良好实验结果的有效例证，但它并不一定预示着计算机行业将能应用人工智能来有效地改善人机互动的方式。“那种认为你可以对着你的电脑做手势的想法，简直是胡说八道。”布拉德斯基说。

　　“机器学习”技术，或依赖于从可获得数据模型中学习的人工智能的更好应用，将用于制造半导体和其他产品，布拉德斯基表示。他还提到，自己所在的小组开发了一个系统，对硅片中的芯片质量进行预测，目前在英特尔公司已经得到应用。英特尔公司的每个硅片部件在与电子器件一起打包后要进行检测，但是如果在切割和打包前就能够清除不良部分，将使公司节省不少检测费用。英特尔公司计划稍后发布“学习引擎”，之前公司要先期发布一种开源系统，它使得机器能够学习和掌握程序员的开发工具。该小组计划今年发表一篇论文来公布这个发现。

　　布拉德斯基目前正在斯坦福大学（Stanford University）调休。他表示机器学习也将影响用户界面的设计，使电脑在预测用户需求上更加主动。比如，英特尔公司正在研究统计方法预先计算问题答案，这些都是用户在特定程序的下一个步骤最可能问到的问题，这种统计方法是基于以往类似的问题被提出的频率来设计的。

　　英特尔公司还在研究，机器学习如何被应用到制造和医疗等领域的无线传感器网络中去。这些由电池支持的传感器，有着少量嵌入式运算和网络设备，他们能够间歇性地被唤醒，然后把周围的环境数据传到中央计算机，然后回到低能量的数据采集模式，这样一来，理论上他们可在无需维护的状态下运行数年。布拉德斯基表示，在不远的将来，连接到传感器网络的计算机，比如英特尔公司在一个芯片工厂做试验以监控设备状况的那台计算机，可能包括机器学习运算法则，当机器偏离了预期表现时会对操作者发出警告。视频摄像系统能应用人工智能法，则能在机场对丢失的行李与经过的人群之间进行比对。“人工智能，将伴随着传感器的广泛普及而得到促进和发展。”布拉德斯基补充道。

微软公司：帮助人类记忆

　　埃里克·霍维兹（Eric Horvitz）是微软研究院（Microsoft Research）的一位贝叶斯统计员，他同时还拥有斯坦福大学的医学学位。他想像了这样一个世界：计算机能记住我们生活中里程碑式的大事，来帮助我们保管好以数字化形式存储的信息。霍维兹是微软研究院适应系统和互动小组（Adaptive Systems and Interaction Group）的高级研究员和经理，他以创建“关注用户界面”（Attentional User Interfaces）而闻名，这种界面在微软公司的Office 和视窗（Windows）软件中都有所体现，它能“学习”PC用户的时间表和任务参与程度，以便决定哪些电子邮件、语音邮件和即时消息可以显示，以及按照怎样的频率显示这些信息。

　　该小组最近的工作中有一套被称为“Memory Lens”的项目，它能寻求增强人类的记忆，通过运用软件分析用户的会议、演示和假期的日程安排，以及PC桌面行为、电子邮件踪迹、数字照片和其他进出电子数据，以分辨出某些重大事件，以后可用做参照系来安置信息。“假如一台计算机能像人类的伙伴一样，能懂得如何分享重要的记忆，那么情况将会怎样呢？”霍维兹说，这必将改变用户与系统互动寻找信息的方式，从发给同事的电子邮件到家庭聚会的照片等都可以。“于是你可能会说，‘不，那是去年（人机互动）大会之前的，’或者说‘不，那是之前复活节的照片。’”他这样说道。

　　在该小组即将发布的一份报告中，将会公布一个被称为“生活浏览器”（Life Browser）的应用软件。

　　这个软件能在用户的Outlook日程表中进行事件搜索，创建一个图书馆，然后分析个人和工作的照片、演示快照以及会议录像片段，来推断出个人生活中的哪些事件应该作为标志性事件而被记住。用户在与机器正常互动范围之外，所参与的其他事件，比如作为事件的组织者、参加者或地点被给予重点关注，还有那些延续时间超长的事件也被特别关注。这项工作非常消耗CPU资源，但是随着芯片速度的加快，情况可能会有所改观。根据该小组去年发布的研究报告，该软件取得的效果到目前为止与用户的记忆十分吻合。

　　如果该技术推向市场，就能帮助微软公司通过客户定制提高PC和互联网搜索的相关性。“针对用户的提问，MSN Search、古狗（Google）或雅虎（Yahoo）等搜索引擎的设置所给出的搜索结果都很一般。”霍维兹称，“但是你我可能有着截然不同的搜索目标。”通过分析用户在PC上的工作以及关键性的记忆，搜索结果能潜在地以“广泛”形式回馈到机器中，然后根据特定用户的兴趣和关键生活事件被重新分类。 “把个性化搜索转化到我们的产品中，是目前我们团队首要的技术转化任务。”他补充说道。

　　霍维兹的小组还在建造模型软件，能把人工智能的规则运用到智能电话上，但智能电话并没有加载过多的运算能力。研究人员开发了一种称为 “SmartPhlow”的应用软件，把智能电话的小屏幕和电话键转化为能解释交通数据的方式。该软件把一个大型视频空间，比如美国西雅图地区的公路地图，转化为更容易管理的信息群。SmartPhlow从一个Web服务中提取数据，这项Web服务能够提供可能的或正在形成的交通堵塞的信息，然后把大的西雅图地图切分成3乘3的方格，与键盘上的1~9的数字相对应。按某一个键让用户对某一地区进行放大处理。按0就是“飞行”的效果；交通状况越复杂或越出乎用户所料，用户界面在该地区停留的时间就越长。

　　另一个移动应用软件称为“贝叶斯电话”（BayesPhone），于今年7月在苏格兰爱丁堡的“用户模型”（User Modeling）大会上用论文的形式发布。这个软件能在视窗电脑上对规则进行预先计算，根据对用户日程表和被干扰成本的背景分析，决定是否转接一个手机电话或是将它转到语音邮件上。

　　这两个应用软件都阐述了霍维兹所称的小型设备的“流动化智能”（Streaming Intelligence）。“这些人们揣在口袋中的设备能提供现时的支持。它不是一个你用来提问的木制专家系统，也不是一个专门的搜索引擎。它是活生生的动态工具，你在生活中会一直使用到它。”

帕洛阿图：人工智能被关注

　　帕洛阿图研究中心的计算机科学家还正试图激活用户界面，它的方法是把原始信息替换为计算机自我选择的信息，这些信息正是计算机所推断出来的用户最想了解的那些内容。该中心的用户界面小组在今年1月发布了一份报告，描述了称为“ScentHighlights”的新软件，它能通过从电子书中摘录关键句来帮助用户扫描信息，这些句子与用户在文章中键入或点击的关键词密切相关。中心高级研究员和用户界面研究经理斯图亚特·卡德（Stuart Card）表示，帕洛阿图研究中心曾提出了“信息气味”（Information Scent）理论，根据这一理论，计算机系统会对吸引用户注意力的东西进行回应，这一研究项目是用户界面研究的一个新兴分支。

　　卡德1974年就加入了帕洛阿图研究中心，在用户界面领域开展了早期的研究，他的研究显示了电脑鼠标的应用性。卡德表示，该中心的用户界面研究充分结合了几项相关的技术，即一方面利用了传统的人工智能技术，另一方面，采用了贝叶斯统计方法对文章中出现的词语进行统计分析。在传统的人工智能技术中，软件试图形成逻辑群，称为“本体论”，来推断概念间的关系。例如，“知更鸟”和“麻雀”同属“鸟”的大类别。在这种方法之外，该中心的电子书界面还使用了新的人工智能方法，“我们与语言学家和人工智能小组共同工作，使我们更上一层楼。”卡德表示。

　　ScentHighlights帮助电子书对内容进行推断。有本名为《生物危害》（Biohazard）的著作讲述了作者肯·阿里贝克（Ken Alibek）在前苏联研制生物武器的亲身经历。

　　在该书电子版的实验中，用户浏览文章的章节，有效地完成了诸如寻找和比较事实的任务。

　　用户键入或标示几个词组，系统就会自动以彩色显示出与这些词语完全匹配的关键词，而和他们有关联但并不完全匹配的段落则用灰色显示出来。该中心研究员爱德·迟（Ed Chi）表示：“当我键入一些单词，这个软件似乎明白我到底想阅读哪些内容。其实，人工智能就是形式识别（Pattern Recognition）的一部分。”

　　人工智能研究可以追溯到1956年。当时，斯坦福大学和麻省理工学院（MIT）的先驱人物在达特茅斯大学（Dartmouth College）召开了一次会议，专门探讨这项技术。如果批评者们说这项技术辜负了大家的期望，那可能是因为实践者所制定的目标过高了。而如果今天的人工智能研究员们仍能保持50年的热情，那也算是对他们成功的一个衡量标志了。

善解人意的计算机

　　在具有人工智能和语言分析功能的软件语言的帮助下，未来计算机将具有更好的理解能力

　　有一种新的软件语言，能够使计算机理解每个指令背后的具体含义，使他们能在生产环境中，更正确执行各项操作。这个软件语言被称为流程-标准 -语言软件（Process-Specification-Language Software，简称“PSL软件”），由美国国家标准与技术研究院（National Institute of Standards and Technology，简称“NIST”）的联邦政府研究人员，以及来自法国、德国、日本和英国等其他国家的同事们共同开发，目的是使未来的计算机比现在具有更好的理解能力。

　　“流程”这个概念是整个生产周期的基础，它与设计和车间生产中的工作流是同一类概念。ISO 18629PSL软件采用了人工智能和语言分析，能够在生产计划的框架内显示出计算机的指令。

　　简单地说，“PSL软件”实际上就是两套应用软件之间的翻译—一套是生产流程运营系统，另一套是流程计划系统，目的是为了消除两套系统各自所采用的术语定义中有可能存在的歧义。

　　NIST的报告称，研究人员将周期和次序等大约300个概念整合到软件架构中。这种软件语言所具备的人工智能特征，使系统能够对指令进行解析，比如“在装船前先油漆”。于是，系统就能明白，“油漆和干燥”工序必须在下一道工序，即装船之前完成。

　　NIST 机构的PSL项目负责人迈克尔·格鲁宁格（Michael Gruninger）表示，现在人们编写的点对点译码器（Translators），既无法消除所有的歧义，而且也不能被重新利用。而PSL软件的优势在于，它能被重复使用，而且还能用来连接各种各样的应用软件。格鲁宁格预测，也许在1年内，PSL语言就会被作为一种Web服务来提供给市场。

　　NIST的研究人员认为，ISO 18629语言特别适合于生产流程计划的交换、计划的批准、生产进度安排，以及控制指导生产流程的信息等等。目前，国际标准组织已经批准了标准的6个部分，并正在对这个标准的最后3个部分进行审核。一旦国际标准组织通过了PSL语言，软件供应商就能利用它来建立各种各样先进的生产系统了。

　　—文/Eric Chabrow 译/Cathy Ji

（信息周刊）

关注我们