【IT168 信息化】
受经济危机的影响,BI(商业智能)市场增速放缓。不过在云计算、数据管理的融合趋势,以及开源浪潮的影响之下,BI开始释放出崭新的活力与激情。未来十年,变革与创新有望缔造一个全新的BI世界。
经济危机对于各个IT领域造成的影响不尽相同。一方面,紧缩的IT预算反而激发了一些与管理、自动化相关的IT需求;但另一方面,包括BI在内,一些与业务数据深度挖掘与处理的需求开始放缓。据Gartner 在2010年4月发布的《2009年全球市场份额:商业智能、分析和绩效管理软件》调查报告显示,与2008年相比,整个BI市场规模在2009年增长了4.2%,达到近93亿美元。其中,BI平台占全球BI软件收入的64.2%,全面绩效管理(CPM)套件占20.8%的比例,而分析应用和绩效管理软件各占了总市场的15%。而在2009年,SAP依然占据全球BI市场的头把交椅,其BI软件总收入约为21亿美元。
Gartner 认为,2009年BI市场增幅与2008年相比明显下降的事实表明,BI市场尚未摆脱经济危机所带来的负面影响。虽然BI是企业常用的IT工具之一,但保持两位数强势增长的岁月可能一去不复返了。剖析BI市场增长放缓的原因,该领域近期发生的连续并购、技术的成熟,以及因充分竞争导致的价格下降,应是造成这一局面的主要原因。但是作为一个持续稳步成长的市场,BI本身仍蕴含着强大的更新与延展能力。尤其是在技术创新方面,伴随着整体IT技术的演进,BI不断探索新的发展空间。与此同时,该领域内高密度的大额并购(重要的收购事件包括甲骨文收购Hyperion,IBM收购Cognos和SPSS,以及SAP收购Sybase),赋予了BI在产品及解决方案层面广阔的纵向扩展空间。此外,在大型BI供应商巨型的身影之下,还游弋着许多技术创新和产品差异化的机会,等待新兴BI厂商捕捉。
成熟并不代表着老去,也不意味着止步不前。事实上,BI技术仍然拥有向前演进的澎湃动力,而它每一次的创新步伐都与IT产业的整体推进密不可分。
BI新趋势1:SaaS BI的崛起
2010年2月,BI市场的老大SAP推出了SaaS BI解决方案——SAP BusinessObjects BI OnDemand。该产品能与Salesforce.com的CRM紧密集成,对用户的CRM数据进行分析和挖掘。SAP BusinessObjects BI OnDemand面向中小企业用户,以及大企业中偶有简单BI需求业务人员,具有快速部署、简单易用等特点。价格方面,该产品提供了相对灵活的定价模式,包含个人免费版、基本版和高级版三个版本。在欧洲,其基本版和高级版的定价分别为每用户每月20欧元和60欧元。
SAP用实际行动吹响了主流传统BI供应商投身SaaS BI这一新兴市场的号角。在此之前,该领域只聚集了小规模的新兴公司,例如Birst、PivotLink、Good Data、Indicee等。让人有些遗憾的是,SaaS BI市场的开拓者之一LucidEra公司,已经在2009年6月宣布停止运营,相继退出该市场的还有BlinkLogic等公司。这证明了新生市场竞争的残酷性。在从传统BI厂商遗留的市场空间中夺取可观收入的同时,新生代之间原始而残酷的竞争让人窒息。
好在这段混沌时期已经过去,SaaS BI的投资价值和市场可见度显著增加。从一定意义上讲,2010年是SaaS BI与本地运行的传统BI开始抗衡、并跻身主流应用的元年。从产品的功能性角度分析,SaaS BI工具提供了令人称道的可用性、协作性和易用性,让用户在不借助过多IT支持的情况下,轻松使用BI功能。此举有望大幅扩充BI的使用群体。传统的BI工具太过昂贵,且使用过程复杂,IT部门往往只针对关键业务部门的领导层及企业决策层定制开发报表分析等应用,大多数的业务员工被排除在BI用户群体之外。
在现阶段,用户如果使用SaaS BI,通常需要先把数据按照约定格式上传给服务商,由服务商使用合适的数据建模处理数据,生成一个Web界面,用户可以以此为基础进行查询等操作,或者生成报表或仪表盘。不同厂商提供的SaaS BI服务存在功能上的差别,有些服务支持随机查询,有些服务则支持其他SaaS应用(例如Salesforce.com的CRM应用)利用BI的计算结果。还有一些更为专业的厂商,提供诸如数据集成、ETL(数据抽取/转换/加载)等服务。就目前的SaaS BI服务模式而言,用户业务数据的安全性与集成的准确度是用户近期关心的热点问题,也是SaaS BI服务供应商需要重点改进与完善的领域。
BI新趋势2:向云迁移
SaaS BI的流行可以看作是BI向云迁移的一个步骤或环节。虽然不同的BI供应商的说法有所区别,但向SaaS的转型和向云的迁移在方向上是基本一致的。虽然在目前,大多数的机构都是在内部解决BI问题,但是在未来的三年中,这一状况有望彻底改观。
一项在2010年5月进行的CIO调查发现,约有五分之一(23%)的受访者预计,云或SaaS(软件即服务)将在三年内成为其主要的BI解决方案。这比当前7%的水平有了大幅度提升。此项调查涉及335位在企业内部使用BI和分析工具的CIO。其中,无线联网服务商Enfora公司的CIO Steve Pike表示,其所在的公司已经将客户服务和支持迁移到了基于云的解决方案中。“迁移过程很简单,而且平台的敏捷性很高。你可以迅速看到成果,并且使用其中的信息。”他说。
不过,尽管云BI解决方案的潜力巨大,但企业内部的BI解决方案仍然占据着支配地位。调查还显示,有93%的受访问者仍在使用企业内部的BI工具,而且有77%的受访者预计,将在未来的1~3年中继续使用内部BI工具。也有企业的CIO坚称,将继续沿用内部解决方案。他们给出的理由是,企业拥有太多的异构系统,要想部署云会非常困难。
尽管BI向云迁移的过程中还面临许多的问题,但随着越来越多的企业将其业务应用置于云端,“在云中部署BI”绝不是一个遥不可及的目标。在数据集成领域,专业厂商Informatica已经进行了向用户交付云服务的尝试。2010年6月,Informatica Cloud 2010夏季版全面上市。此前该公司发布的Informatica 9数据集成平台已经能够同时部署在预装系统或“云”网络之中,为用户提供云端集成能力。Informatica Cloud 2010夏季版则通过支持云计算数据质量和B2B数据转换的配套插件,再度拓展Informatica的云数据集成服务。据Informatica提供的统计数据显示,目前Informatica Cloud的用户已经超过600家,这些企业一天需要运行超过30万个集成作业,在系统间每月集成超过60亿行信息。
基于云的BI要完全替代传统BI还要假以时日,但云计算在全球的盛行,必将对BI向云的迁移进程产生积极的影响。有分析人士指出,BI领域内充分的竞争导致了价格的下降,这也意味着该领域的参与者正面临更为激烈的竞争局面。云的重要性已经能够影响到BI厂商未来的生存。从一定意义上说,只有产品是面向云规模架构设计、并符合云运营模式的厂商才能在未来取得成功。因为在云的运营模式下,每增加一个客户厂商所付出的成本趋近于零,这无疑将为BI供应商带来丰厚的收益。
BI新趋势3:融合,再融合
数据质量、数据集成和数据虚拟化将与主数据管理融合,构成处理结构化数据和非结构化数据的统一信息管理平台。众所周知,数据质量自数据管理系统出现以来,一直是IT系统的一大痛处。它困扰着许多企业的CIO和IT人员,造成系统部署、生产力和时间成本上的巨大损失。从技术的发展趋势上分析,数据质量和数据集成将实现更为紧密的整合,从而在底层解决数据质量的问题,让正确、纯净的数据进入应用的下游。
SAP BusinessObjects、SAS、Informatica及Talend等公司目前都可以在某种程度上提供上述能力。此外,由于企业中的数据源呈现爆炸式增长,为了能够把所有数据源集成到单一物理位置,并保持存取的灵活性,Composite等厂商为客户提供数据虚拟化能力。借助这种能力,规范的信息模型可以覆盖在信息资产的顶部,不管这些信息资产位于何处,规范的信息模型都能够处理批量、实时和事件数据源组合。这些全异的数据源必须通过主数据管理能力来协调。通过这种能力,客户、供应商、产品等企业中的关键实现定义可以被用于提供这些分散的数据源之上的语义统一。最后,结构化、半结构化和非结构化的信息,都能利用文本分析能力和数据虚拟化技术,从一个无处不在的信息管理平台实现数据的提取、转换、加载与查询。
BI世界酝酿融合的另一趋势是,有越来越多的数据挖掘、预测分析能力被引入到数据库系统之中。回顾历史,虽然以分析为中心的OLAP(联机分析处理)数据库已经问世几十年(以甲骨文Express、Hyperion Essbase和微软的Analysis Services为代表),但是它们从未在数据库市场真正占据统治地位。过去的数十年,RDBMS(关系型数据库管理系统)一直是市场的主宰,应用的类型似乎并不重要,关系型数据库才是核心与关键。
然而,在今天的海量数据时代,传统数据管理的颠覆与变革已经无法回避。Google(BigTable)、Yahoo (Hadoop)、Amazon(Dynamo)、Facebook(Cassandra)等大型Web厂商纷纷自行开发解决方案,以处理由互联网应用产生的海量数据。另一方面,专注于分析性工作负载的数据库产品正在形成集群效应。掌握内存处理、利用并行机制、柱状存储选择等创新技术的Netezza、Greenplum、Vertica、Aster Data等新兴厂商不断发展壮大。
在这些新的数据库产品的引擎中,具备了可编程性和并行处理能力。这种可编程能力让开发人员能够将计算迁移到数据库或数据仓库内部,避免了因数据迁移所造成的响应缓慢问题。另外,配合并行、大规模并行处理(MPP)架构的性能和扩展性优势,用户可以获得高吞吐零,以及用于欺诈探测、风险管理等目的的运营分析能力。
其中,Netezza为用户提供软硬一体的数据仓库设备。对于BI的开发者而言,基于这一整合环境无需进行系统配置和物理建模,无需钻研数据模型,即可执行数据分析任务。
Greenplum和Aster Data同样是MPP数据仓库市场的生力军。其技术都基于MapReduce并行处理框架,后者是谷歌用于实现索引和搜索扩展性的技术。MapReduce是一个开源的Apache Hadoop项目,它是Hbase开源、分布式、列存储数据库系统的基础。
BI新趋势4:开源BI进入成熟期
采用本地运行模式的传统BI面临的不仅面临着云或SaaS应用模式的冲击,开源BI同样也是一个关键的颠覆者。开源BI的开发者希望改写闭源、传统BI占统治地位的市场格局,而他们已经在这条道路上付出了长期的努力。
经济危机及其引发的持续经济低迷,为开源BI提供了发展的良机。面对紧缩的IT预算,很多企业发现,基于开源BI的数据分析、报表制作或数据集成,能够让它们以有限的资金高效率地解决实际问题。这也正是Pentaho、JasperSoft等公司近年来以远超过行业平均值的增长速度发展壮大的原因所在。
借助开源BI解决方案,用户可以以构建传统BI应用几分之一的费用搭建完整到端到端BI栈,而这种选择还可以获得良好的自上而下的采用率。这应该是企业应对严酷经济形势的一种生存之道。而在端到端的BI栈中,很多产品已经达到或接近了闭源BI工具的应用成熟度水平。在报表、OLAP、数据统计、数据质量、数据集成、主数据管理等领域,企业用户均可以找到经济、高效的开源BI工具(市场上主要开源BI工具如附表所示)。