信息化 频道

逃离信息孤岛 用3D-VE管理非结构化数据

  无论是数据库技术还是存储技术,都只解决了15%的结构化数据的管理问题,85%的非结构化数据还孤悬在一片“信息孤岛”上。
   
  【IT168 专稿】GOOGLE一下“非结构化数据”,搜到的简体中文和繁体中文页面有131万之多,其中相当多的网页引用了同样的数据:“非结构化数据的信息占信息总量的85%以上。无论是数据库技术还是存储技术,都只解决了15%的结构化数据的管理问题,85%的非结构化数据还孤悬在一片信息孤岛上。”

处理非结构化数据的5个步骤

  相对于结构化数据而言,非结构化数据量更加巨大。非结构化数据可以粗略分为数字媒体类和文档类两种,数字媒体类主要包括声音、图像、视频等多媒体数据;而文档类主要包括文档、传真、演示文稿等数据。
   
  据Unisys中国区客户解决方案部高级项目经理王立生介绍,企业的非结构化数据处理过程包含采集、存储、管理、展现及归档5个步骤,它们各有不同的作业目标,配套的信息技术也大相径庭,但每个环节却又互相影响,可谓牵一发动全身。采集阶段的工作目标是尽量扩大数据收集的途径,确保企业能够捕捉宝贵的信息,因此采用的技术包括影像扫描、输入设计、文字识别、聚合、索引及分类等。采集数据量大增,自然对下一个阶段“存储”构成压力。而存储的首要任务是按照数据的重要性来分类,然后分配有关的存储资源,近年来讨论甚多的“信息生命周期”或“分层式数据存储”就是用于这个步骤的一些技术方法。

0
相关文章