促进世界转型
在寻找问题的答案时,您通过什么方式?如果与目前的大多数人一样,您打开电脑、手机或移动设备,将问题输入到搜索引擎,您会看到许多网站链接,您有可能会找到答案。如果这种方式行不通,您会修改搜索条件,直到得到答案。从电话铃响起到赶往图书馆找到答案,我们经历了很长时间。
但如果您只是向电脑提出问题,然后就能得到确切答案,而不是一个文档或网站列表,情况又会怎样呢?问答(QA)计算系统的开发目的是理解以自然语言提出的简单问题,并以文本形式提供答案。您提问“俄罗斯首都是哪里?”电脑根据已经装入的信息而回答“莫斯科”。
IBM正努力进一步提升这种能力,因此开发了沃森,使其能够理解词语所隐含的确切含义,区分相关和不相关的内容,并且最终给出可信的准确答案。由于对语言的深入理解,沃森可以处理并回答更复杂的问题,包括自然语言中常见的双关语、反语和谜语。2011年2月14-16日,IBM沃森将参加竞赛,在Jeopardy!的三场比赛中对决节目历史上最成功的两位选手:KenJennings和BradRutter。
技术突破
要想成功地在Jeopardy!上与选手竞赛,沃森必须分析每个问题,确定准确的问题,分析可用于提炼确切答案的内容,并且根据发现的支持信息和反驳信息而快速计算答案的可信度。
在分析问题和确定非常好的答案的过程中,沃森采用先进的自然语言处理、信息检索、知识表示和论证、机器学习技术和开放域问答技术。沃森的核心是采用IBMDeepQA技术实现假设生成、大量证据收集、分析和打分。它的内部已经装载了数百万份文档,包括词典、百科全书、分类学、宗教文本、小说、戏剧和其它参考资料,可用于构建自己的知识。
与只能理解基本问题并以相关文档列表形式返回答案的搜索引擎不同,沃森可以理解以自然语言提出的问题,并返回直接回答问题的准确答案。沃森不依赖单一算法,而是利用数百种算法寻找备选答案,对这些答案进行打分,收集每个备选答案的更多支持性证据,并使用复杂的自然语言处理技术深入地评估这些证据。独立得出同样答案的算法越多,可信度就越高。沃森对每个备选答案的所有证据进行权衡,以识别出非常好的答案,并确定该答案的可信度。如果可信度足够高,沃森就会按下抢答器回答问题。
沃森的技术有望通过逐步改进而投入商用,是多个行业实现转型。例如,在医疗行业中,它可以作为一种在线工具,帮助专业医疗人员制定诊断方案。医生可以输入一组症状和医疗记录,并接受可能的诊断,帮助医生确定最终诊断和治疗方案。零售商可以利用该技术帮助购物人员找到确切的商品。对于旅行者来说,它可以帮助规划最可行的度假方案或交通路线。
“挑战在于构建一个与以前不同的系统,在确定自然语言问题的准确答案以及计算答案中的准确可信度方面,能够与人脑的能力相抗衡。这种可信度处理能力是关键所在。它区分了IBM的方法与传统的搜索方法,而且是将问答技术用于商业应用的关键。”
________________________________________
DavidFerrucci博士
DeepQA/Watson项目首席调查员
“IBM开发计算系统,在美国大受欢迎的智力竞赛节目Jeopardy!中挑战真人”
2009年4月27日