质量决定数据
最近,北京天坛医院的信息中心主任王韬正在考虑建立一个“医疗鉴别诊断知识库”,供临床经验还不是很丰富的新医生诊断病人病情时参考使用。之所以有这样的计划是因为天坛医院此前在国内医疗行业率先使用了PACS系统(医学影像存档和通信系统),以取代传统的胶片把病人的病历影像资料用数字化图像的形式保存下来。“短短几年,我们医院积累的影像数据量已经超过6个T。”王韬说。
这些影像数据资料除了供当时接受诊断的病人使用外,对其他医生诊断别的病人也是很珍贵的参考资料。于是,王韬想通过建立“知识库”,从这些海量数据中筛选出有价值的影像数据资料,以实现医生知识共享。此外,他还打算建立天坛医院的辅助决策系统,让医生能方便地访问筛选出的有效数据,从中自动选取对他们有价值的资料,帮助医生诊断病人病情、制订治疗方案。王韬的这个设想与新兴的数据治理的提法不谋而合。
“数据治理的意义就是发挥出数据的最大价值。”Informatica公司大中华区总经理田哲夫说。10多年的信息化建设已经让中国企业发现,数据是企业管理的“命脉”。如何让积存已久的数据“重见天日”,将数据的价值真正发挥出来成为数据治理的重点。
企业运行需要依赖各种信息系统,不同系统具有不同的数据结构;此外,同一企业跨地区、跨领域获取的数据也需要归类,这些都涉及到对数据的提炼和管理。
此外,信息产业层出不穷的新技术一方面在产生大量数据,另一方面对数据质量有着更高的要求。时下很热门的RFID技术可以对养殖场里的任何一只鸡的生长过程进行跟踪,记录每只鸡从出生到运走的每天饮食和活动数据。这些数据可以为防范禽类疫病传播提供参考依据。这些必然要求企业建立一个强大的数据平台对各种信息系统采集的海量数据进行提炼、归纳和选取,才能在最短的时间配合相应的信息系统分析处理数据,让企业的IT投入快速、高效地产出。