信息化 频道

数据挖掘技术在舞弊审计中的应用

4 基于数据挖掘的舞弊发现过程模型

    为发现舞弊行为,数据挖掘需要面对的是关系复杂的企业全局视角的知识发现,因此进行数据采掘一般要花大部分力量在数据准备阶段。但是,不同历史阶段企业内部许多部门建立了各自的信息处理系统,这些系统之间相互隔离,结构各异,因此很难得到企业全局的信息。审计人员需要使用(历史的、现在的)数据和多个系统数据进行各种复杂分析,以发现审计线索。这不仅要求系统保存大量的历史数据,而且还要进行复杂的分析处理(每次处理涉及大量数据),这对于业务处理频繁的业务数据库系统而言,将成为沉重的负担。数据仓库面向复杂的数据分析,集成企业范围内的数据。它把数据事先收集、归纳、处理,使企业的业务操作环境和信息分析环境分离,从而有效地为决策提供实时的信息服务。从这一点上讲,基于数据仓库的数据采掘能更好地满足审计的要求。而且,数据仓库机制大大降低了数据采掘的障碍,而在数据仓库中数据已经被充分收集起来,进行了整理、合并,并且有些还进行了初步的分析处理。这样,注意力更集中于数据采掘的核心处理阶段。另外,数据仓库中对数据不同粒度的集成和综合,更有效地支持了多层次、多种知识的采掘。基于此,舞弊审计中的数据挖掘技术应该基于审计数据仓库基础之上。


    本文根据美国研究所总结的数据挖掘方法(SEMMA)和斯坦福大学的约翰1997 年在其博士论文中给出的数据挖掘处理模型,强调由审计专家和数据挖掘人员共同参与数据挖掘的全过程、及时沟通,基于审计数据仓库,从舞弊审计需求出发,给出了基数据挖掘的审计线索发现过程的模型框架。如图1所示。

(1)提出审计需求。根据审计的目标和内容要求,描述和表达审计问题,并据此确定数据挖掘的目的。数据挖掘的目的是数据挖掘的重要一步, 挖掘的最后结果是不可预测的, 但要探索的问题应该是有预见的, 盲目的数据挖掘是不会成功的。

(2)理解和分析。数据挖掘人员与审计人员在共同的基础上明确数据挖掘目的,针对挖掘目标,进行数据分析和建模准备。

(3)建模。根据挖掘目标,确定将要进行的挖掘操作类型,如分类与预测、聚类、关联分析等,设计或选择有效的数据挖掘算法,产生数学分析模型并与审计人员沟通,审计人员理解确认。

(4)数据挖掘。数据挖掘人员利用经确认的数据挖掘模型和数据仓库进行数据挖掘。

(5)结果分析与评估。分析并评估挖掘结果,其使用的分析方法一般应视数据挖掘操作而定, 通常会用到可视化技术。

(6)发布审计发现。以一种审计人员能够使用的方式呈现审计发现,在舞弊审计中应用审计发现的知识,最终完成审计工作。

5  结论

    识别财务报告中的舞弊,需要从大量企业内外相关信息中寻找线索,数据挖掘技术帮助审计人员对被审计单位海量电子数据进行分析,获得审计线索,发现审计疑点。建立一个基于数据挖掘技术的舞弊审计模型,充分利用经验丰富的专家智囊及数据挖掘的技术优势,将会增强审计人员的审计数据分析能力,提高舞弊审计的效率和效果,尽量降低其带给利益相关者的损失
 

0
相关文章