信息化 频道

探密百度智能搜索的web3.0时代

  未来学家尼葛诺庞蒂说过,“比特”将代替原子成为互联网数字时代的基因。用“爆炸”一词来形容信息时代的迅猛发展绝不为过。上个世纪90年代,WEB1.0时代搜索引擎才刚刚进入我们的视线,一转眼我们已经被WEB2.0的社交媒体为首的交互式传播所包围,而在大数据、云计算盛行的今天,智能化已经成为我们即将来临的WEB3.0时代的标签。信息成为生活的必须,我们很难想象没有了搜索引擎的入口,将给我们的生活带来多大的不便。而搜索引擎有什么诀窍,在日星月异的科技发展中历久弥坚?

  现代人群获得知识最便利获取信息和知识的方式就是搜索关键字。对于中国网民来讲,“百度一下”已经成为一种潜在的生活习惯,通过关键字检索,获得相关信息。那智能化的搜索引擎究竟是什么样的呢?后面隐藏着怎么样的技术呢?今天让小编来为你揭开这层神秘的面纱。

  “知识图谱”为你贴心构建完整的信息关系网

  首先,我们来做一个实验。打开百度,输入“韩寒”,你不仅会看到百度百科对他的详细介绍,以及他新浪微博的最新动态,还有门户网站对韩寒的最新的报道,以及韩寒贴吧和专辑等的链接。这样的多产品的搜索聚合,把垂直领域的相关信息一网打尽。细心的你一定还发现了,在网页的右侧,出现了与“韩寒”相关的人物链接。除了“国民岳父”的好女儿韩小野,《上海绝恋》中的虐恋情人郭小四,以及水火不容的仇人“方舟子”的链接外,还有老婆金丽华以及传说中的“秘密情人”赵卓娜。如此贴心的智能化服务,不禁让坐在电脑前的八卦人儿会心一笑。

探密百度智能搜索的web3.0时代

  这种以用户为中心的精准化搜索与服务,后面隐藏的技术称为“知识图谱数据分析技术”。知识图谱(MappingKnowledgeDomain)是指用可视化技术来发现、描述、分析以及最终展示数据或文本之间的相互关系。在海量数据挖掘的今天,需要有高速有效精准的算法,将杂乱无章的数据进行分类梳理,并通过可视化技术把结果展示出来。这样一来,复杂的知识体系通过数据挖掘、信息处理、知识计量和图形绘制显示出来,关系网越来越完善,和用户的互动也越来越强。

  这样一来,在垂直搜索的基础上,在水平面上也铺开了一张大网,满足不同用户的各种需求。

  基于“知识图谱数据分析”的智能化算法比拼

  智能化时代,算法要求是越精确越好,特别是以简单可靠为文化宗旨的百度来说,精益求精是激励百度不断完善的目标。对于完美技术的追求,对于创新因子的渴望,是百度一直在努力的方向。

  “百度知识图谱数据分析竞赛”已经近日启动,旨在寻找到更加精确的匹配算法,完善知识图谱分析,创造完美的用户体验,这将是技术达人们的一次盛会。在有趣的比赛方式下,达人们只需要完成百度给出的两个任务,并根据任务要求设计出一套算法,精确高效地达到任务目标。

  任务一是实体相似度计算,也就是说杂乱的数据间,怎么样找出实体间的相似性和关联信息。达人们需要根据实体对应的描述,配对有关联的实体。例如:“韩寒”、“郭敬明”、“田亮”,“韩寒”和“郭敬明”是一对,因为他俩都是作家;“韩寒”和“田亮”是一对,他俩都是“国民岳父”;但“郭敬明”和“田亮”没有相似点,无法配对。任务二需要达人们不仅要挖掘出有关联的实体,还要推理他们的关系,算法越准确,得分率越高。如挖掘出“韩寒”、“韩小野”两个关联实体,进而推理出他们是“父女关系”。

  智能化时代的新生活方式

  文本当然不止文字一种载体,针对于图片匹配、语义识别等识图技术,也在智能化领域应用繁多,在这个人人都有照相机和麦克风的时代,图片成为一种传播的主要文本。特别是以图识图的功能,大大丰富了人们获取信息的渠道。在江苏卫视《最强大脑》有达人快速分辨照片中的人脸特点,作出分类判断,而“识图”算法也将智能化高效地完成这一任务,完成人机“最强交互”。

  在比特时代,人人都在谈大数据。真正有意义的是隐藏在数据背后的关系。WEB3.0时代的智能搜索,关键在于定位精准,如何能通过关键字或者特征图,找到用户心仪的目标,如何以小见大。

  我们将进入智能时代,同时也将进入一个达人和“创客”汇聚的平等、自由的思想碰撞的时代。我们庆幸地看到MOOC的发展和以“百度开放研究”社区为主的技术达人们汇集的平台在飞速发展。

  也许,有了达人们的新算法,在WEB3.0的智能搜索时代,我们应该重新来讲述盲人摸象的故事:从前有个盲人,他摸到了一个类似尾巴的东西,百度一下,他知道了自己摸的是头大象。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章