大数据背景下的审计思考
来源:宝玛科技网
《理财》学术版2014.12 大数据背景下的审计思考 王开一 许昌市审计局,461000河南省许昌市莲城大道1866号,E—mail:xcsjwky@126.com 摘要:大数据是基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源 和知识服务能力。大数据时代的来临,引发了人们的思维变革,本文试从审计计划管理模式、审计实施 管理模式、审计评价模式、审计实施工具、审计人员结构五个方面浅谈大数据背景下的审计思考。 关键词:大数据审计 思考 大数据,或称巨量数据、海量数据,是数量巨大、结构复杂、类型众多的数据集合体,是基于云计 算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。 大数据时代的来临正在和必然引发人们的思维变革,这种变革表现为三种思维转变:第一,不是随 机样本,而是所有数据;第二,不是精确性,而是混杂性;第三,不是因果关系,而是相关关系。基于 这样的思维模式,本文试从五个方面浅谈大数据背景下的审计思考。 一、大数据背景下审计计划管理模式的思考 在信息处理能力受限的时代,人们需要数据分析,但却缺少用来采集和分析数据的工具,因此随机 抽样应运而生。抽样的目的是用最少的数据得到最多的信息,当我们可以获得海量数据的时候,抽样就 没有什么意义了。 李克强总理2014年在听取审计署工作汇报时指出要实现审计全覆盖,凡使用财政资金的单位和项 目都要接受审计监督。而要实现审计的全覆盖,靠传统的审计思维和方式不可能实现,这就要求转变审 计思维方式,就要建立在大数据背景下“不是随机样本,而是所有数据”的思维基础之上。例如,当我 们获取了会计支付中心的数据后,对于所有预算单位来说,就是掌握了所有单位的预算执行会计数据, 这样,对所有预算单位的全部或某一方面(如“三公”经费)的审计全覆盖就由不可能变为了可能。这 就需要改变现行的年度审计计划编制管理模式,由“项目审计计划”管理模式向“项目审计计划+无项 目审计计划”的管理模式转变。 无项目审计是指在充分占有多单位、多年度、多类别数据的基础上,按照一定的审计主题,运用联 网审计自动预警功能或采用人工查询方式,对数据进行批量分析处理,筛查疑点、核查取证,并做出审 计结论的审计方式。无项目审计应当逐渐成为大数据背景下审计实施的主要形式。 二、大数据背景下审计实施管理模式的思考 大数据背景下的“不是精确性,而是混杂性”的思维,是基于数据量的巨大性、数据类型的庞杂性 而提出的,由于数据量太大、太庞杂,以至于我们无法用精确算法,而代之以模糊算法;无法用复杂算法, 而代之以简单算法。如前面提及的运用会计支付中心数据审计所有单位“三公”经费的情况,就是一种 简单的模糊算法,审计人员只需运用简单的SQL语句就能实现。之所以不要求其精确性,是指我们建立 47 《理财》学术版2014.12 在会计支付中心记账规范化这一基础之上的,而容忍了记账不规范的情况,但这种容忍换来的是全部预 算单位“三公”经费审计全覆盖这个更大的成果。如果不采用大数据的模糊算法,而是选取部分单位作 样本进行详细审计,把抽样审计的结果作为所有单位“三公”经费支出的平均水平。很明显,以全部预 算单位的审计结果即使有误差也比无误差的以样本推断全体得出的结果准确得多。 在审计全覆盖模式下,对传统审计思路提出了新的挑战:一是要从对点的审计变为对面的审计,无 项目审计就是对面的审计,审计揭示的问题由个性变为共性,由微观变为宏观,由具体的事务层面变为 一般的机制层面。二是由对会计报表、会计账簿、会计凭证的审计变为对数据库的审计。三是审计 重点由核查变为挖掘、分析和预测,数据分析将是审计实施过程的主要方面,核对、查阅原始凭证只是 极少量的辅助性工作,表现为对审计疑点的核实。 三、大数据背景下审计评价模式的思考 舍恩伯格在他的《大数据时代》一书中指出“不是因果关系,而是相关关系”,不需要知道为什么, 只需要知道是什么。我们可以这样理解,在“小数据背景下”,我们在开展专项资金审计时,一般是顺 资金流向采集和分析数据,即上级主管部门的指标数据、财政部门的拨款数据和项目实施单位的支出数 据,审计的方法是检查三者的一致性程度,审计的目的是核查真实、揭示问题、优化管理。因为这三种 数据之间有因果关系,这样的审计思维就是“因果关系”的思维。在大数据背景下,之所以“不是因果 关系,而是相关关系”,取决于大数据的核心是预测,就是站在“世界是普遍联系的”这一哲学高度审 视世间万物,广泛收集各方面的数据,不管是有用的还是看起来没有用的。然后通过分析师的挖掘,将 这些风马牛不相及的数据关联起来,从中预测事物发展的规律。 用这种“不是因果关系,而是相关关系”的思维进行预测,体现在审计报告中,就应当是在对经济 活动真实性、合规性、效益性进行评价的基础上增加对经济活动规律性的评估和预测。 实际上审计预测早已出现在我们的审计报告之中了,如2011年地方债务审计中关于地方 债务未来偿债能力的预测和债务风险的预测等,只是这样的思维还是个别的、偶然的、非主流的。随着 大数据时代的到来,审计评估和预测将是审计报告中的一项重要内容,唯有如此,才能充分发挥出审计“免 疫系统”的预警作用。 四、大数据背景下审计实施工具的思考 “一切都可量化,万物皆是数据”,这是大数据时代对世间万物的概括。数据的混杂性决定了作为 数据的载体和数据的表现形式是多种多样的。大数据类型众多,不仅仅指结构化的数据类型多,更是超 越了目前我们所认知的结构化的数据类型,还包括非结构化的数据,如文字、图像、影像、语音、方位等。 而这些数据的存储方式和承载介质也不一样,如数据分析师对流感的预测是根据“流感如何治疗”之类 词条出现在网络搜索中的点击率,其介质是网络;数据分析师对中国足球队老是输给西方足球队的原因 分析是根据双方球员在赛场上的奔跑速度和长度,其介质是视频;我们正在开展的全国土地出让金收支 和耕地保护审计中关于土地版图的识别是依赖于卫星图片不同时期的变化,介质是图像。所以,不同表 现形式的数据,其承载介质不一样,对审计工具的要求也不一样。应对大数据对审计工具的要求可从两 个方面考虑:一是可存储的数据,二是不可存储的数据。 可存储的数据,即审计机关能够量化的数据,是我们在审计过程中能够采集到并存储于我们所拥有 介质中的被审计单位的各类数据。这些数据包含结构化数据和非结构化数据。从这方面来说对审计工具 的挑战主要是服务器扩容的问题和数据分类存储的问题,即多大容量的服务器能承载下日益扩充的审计 数据;什么样的分类标准才算是最佳的数据分类方法,才更有利于数据的存储和挖掘。 《理财》学术版2014.12 不可存储的数据,即审计机关不能够量化的数据,是我们不能够在审计过程中采集并存储的各类数 据。这些数据同样包含结构化数据和非结构化数据。这一方面需要我们解决的已不是服务器容量大小的 问题,而是如何获取和利用这些数据、用什么工具挖掘这些数据的问题,即不求所有,但求所用。如互 联网数据,我们无须考虑如何存储它,而是在审计工作中如何挖掘和运用它。 五、大数据背景下审计人员结构的思考 近年来,一种新的职业出现了,那就是“数据科学家”。数据科学家是统计学家、软件程序员、图 形设计师和作家的结合体。如果说科学家可以通过显微镜发现事物的不同,那么数据科学家则是通过探 寻数据库群来得到新的发现。审计是个与数据充分接触、依赖数据而生、用数据说话的行业,近几年来, 审计机关积累了大量的数据,而且数据积累还会越来越多,但对于数据分析的技能依然欠缺,由于缺乏 专业审计分析师对这些数据进行关联、挖掘和分析,许多数据在服务器里睡大觉,如何激活这些数据, 让被遗忘的数据成为预测未来的数据宝贝,这必然要求审计队伍中有一支数据分析的专家级团队。 大数据技术为实现审计全覆盖提供了数据和技术支撑,要实现审计全覆盖,充分发挥审计“免疫系统” 的预警和防范功能,需要深入广泛地开展无项目审计,通过审计分析师的辛勤劳动,从巨量的各不相关 的数据中挖掘出有用的审计信息,预测经济活动的规律,预测未来的经济发展趋势,这必然要求有一大 批专业的审计分析师。所以,未来的审计人员,半数以上必然要成为审计分析师,才能支撑起审计全覆 盖的历史重任。 现在越来越多的审计人员开始运用数据库技术开展审计,从简单的财务审计中逐渐脱离出来,沉浸 到越来越大型、越来越复杂的数据审计之中,这是审计的飞跃,也是审计未来的希望。 参考文献: [1]徐瑾.基于信息化环境下数据式审计的特征与实施路径[J].审计与经济研究,2009(1). [2]陈伟,刘思峰.一种基于数据匹配技术的审计证据获取方法[J].计算机科学,2008(8). [3]许金叶,许琳.大数据审计:物联网建设的制度保障[J].会计之友,2013(33). 49