信息化 频道

SAS公司收购Teragram以加强其在文本挖掘和分析领域的领导地位


    【IT168 新闻

    SAS公司在其分析产品链中增加了自然语言处理、自动分类和自然语言企业级搜索技术。

    中国北京,(2008年3月17日) –全球领先的商业智能和分析软件供应商SAS公司今天宣布:收购在自然语言处理(NLP)和高级语言技术.上处于领先地位的私人公司Teragram。此项并购之举将有助于加强SAS公司自身的文本挖掘 和分析型BI产品线,将范围扩展到企业和移动搜索领域。

    早在十多年前,SAS公司就意识到了文本采掘、文本分析以及其他诸如网页、文件、电子邮件、图像和未存储在结构性数据库之中的非结构性数据的重要性,成为为数不多的具有这种前瞻意识的公司之一。如今,SAS仍然在这一重要且不断成长的领域中扮演着领导者的角色。

    SAS公司CEO Jim Goodnight先生表示:“Teragram公司的专业技能和NLP技术的引入,将会使整个BI和分析产品的市场格局发生重大改变。Teragram的技术巩固并提升了SAS融合结构性与非结构性数据方面的能力---不仅在我们的文本挖掘解决方案上,而且将嵌入到整个SAS企业智能平台之中---从而更快、更好地找到问题的解决之道。”

    Teragram 拥有员工40多人,总部设在马萨诸塞州的剑桥,今后它将成为SAS公司的一部分。这次并购案的详细条款并未公开。Teragram公司所独有的NLP技术已经很成熟,并且拥有一定的客户群,其中包括:CNN、Forbes.com、NYTimes Digital、Sony、WashingtonPost.com、Wolters Kluwer、the World Bank和Yahoo!等公司。

    Teragram公司总裁Yves Schabes先生指出:“随着数据爆炸继续呈现发展的趋势,任何企业都需要一种智能的方式对其加以利用,无论这些数据是存储在结构性数据库还是存在于大量非结构性数据源之中。 Teragram以及我们的技术与SAS的分析和文本挖掘技术非常吻合,而且SAS公司仍在不断加大在这一飞速发展领域的开发力度。我们很高兴能够加入到这样一个公司,共同致力于将结构性和非结构性数据进行有机结合的软件事业中,从而帮助用户更好、更快和更准确地进行决策。”

    自然语言处理

    Teragram公司的自然语言处理(NLP)技术将把多种语言和多种来源的文本内容转化为有用的信息,在文字、语言关系和字意层面上实现更加丰富的数据处理功能。Teragram公司已经开发并维护着含有注解的巨大词库,里面包含了数以亿计的词汇,语种多达30多个。

    自动分类

    Teragram公司先进的分类技术能够依据在企业内部广泛采用的客户标准对文件提供快捷和先进的分类功能,这就使得不论原始文件存放在何处,用户随时能够根据特定的主题更加快速和准确地获得需要的文件,满足特定用户的需求。

    自然语言企业搜索

    针对企业级的搜索需求,Teragram的NLP技术可以对结构性的企业数据以及非结构性的数据源进行扫描,包括基于文本的报表和网页,以便从这些不同的信息源中获取综合性的答案。

    Schabes先生表示:“随着当今企业的国际化发展及员工队伍的分散分布,企业内部的各种系统和格式中所存储的数据的与日俱增,如何快速和准确地找到关键业务问题的解决方案显得比以往任何时候都要重要。而企业级搜索就是充分挖掘企业现有数据源的一个有力武器。SAS商业智能、数据整合及高级分析功能与Teragram公司NLP技术的有机融合,将只需几秒钟的时间就能够针对所搜索的问题提供准确的答案。”

    Teragram公司成熟的搜索技术能为企业提供部署和使用BI的轻松环境,从而便于在整个企业内部推广BI的应用。SAS与Teragram技术的相互结合不但可以提供类似报表标题的索引,而且还能够依据实际内容和与之相关的元数据给出必要的索引。


    移动搜索

    Teragram还为SAS带来了下一代的移动搜索功能,帮助个人实现远程信息的扫描,更加快速地获得答案。采用Teragram的移动搜索技术,人们能够存储和检索信息、连接到诸如BI系统的外部应用、来自BlackBerry的搜索数据库、职能电话或其他移动设备。

    非结构性数据中的爆炸

    企业管理专家Bill Jensen先生在2001年出版的书籍《Simplicity》中第一次指出了当今信息爆炸的情形。根据他所做的研究以及众多专家的回应,我们看到即使是最为保守的估计,也显示出目前商业信息以每18个月翻一倍的速度增长着。这一数据洪流在近几年当中表现地愈加猛烈,而且这些数据的大部分都存在于传统的、“结构性”数据库之外。根据估算,非结构性数据 占据了各种商业数据的70%,这些非结构性数据主要体现在客户评论和服务日志、电子邮件和聊天记录、文件和调研、博客与RSS资料、质量保修索赔、简历、语音邮件和电话记录以及其他信息源等。

    如果业务人员没能在他们的分析报告中囊括进这些非结构性数据---有关客户、市场机会、内部运营、供应链等的内容---那么他们只能算是看到完整画面中的一部分,最终导致决策的失误。像SAS这样的分析功能产品将能够帮助企业编制出结构性和非结构性数据,进而揭示出数据背后的发展动态和趋势,同时利用这些洞察信息进行决策,有效地解决问题,并充分利用各种商机。

0
相关文章