滨海县审计局 刘德阳
摘 要:随着社会各领域信息化的高速发展,以电子数据为代表的信息资源大集中模式逐渐成为各类审计信息存储的主流。因此,传统的孤立分析数据,单纯依靠经验发现问题的审计方式已经无法适应现代企业审计工作的需求。这就要求针对“大数据”这个特点,调整工作思路,创新审计手段,完善审计方法。
关键词:大数据 变化 审计创新 审计方法
“大数据”俨然是当前最热络的词汇之一,时刻充斥在你我的身边。现在世界每天产生约25亿GB的数据,预测在2020年数据总量将增至40万亿GB。人类开始真正的进入大数据时代,越来越多的企业单位开始使用大数据进行辅助经营和管理。一直在用数据说话的审计行业面临着前所未有的机遇与挑战,数据的重要性得到了再一次的提升。当前计算机技术与审计工作的结合越来越紧密,大数据分析做为最前沿的计算机技术,必定会为审计工作带来新一轮变化。面对机遇我们必须不断更新理念,夯实基础,以数据为核心将计算机技术与审计方法进行有机融合,做到技防与人防并举。
一、大数据的涵义与特征
(一)大数据的一般定义
“数据”(data)这个词在拉丁文里是“已知”的意思,也可以理解为“事实”。2009年,“大数据”这个概念才逐渐开始在社会上传播。“大数据”概念真正变得火爆,却是因为美国奥巴马政府在2012年高调宣布了其“大数据研究和开发计划”。这标志着“大数据”时代真正开始进入社会经济生活。互联网数据中心(IDC)为“大数据”下的定义:“大数据”是指为了更经济更有效地从高频率、大容量、不同结构和类型的数据中获取价值而设计的新一代架构和技术,用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。
(二)大数据的特征
大数据具有4V特点:第一,数据体量巨大(Volume),从TB级别跃升到PB级别。第二,处理速度快(Velocity),1秒定律,这一点也是和传统的数据挖掘技术有着本质的不同。第三,数据类型繁多(Variety),有网络日志、视频、图片、地理位置信息等多种形式。第四,价值密度低,商业价值高(Value)。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
二、“大数据”的特性给审计工作带来的变化
(一)大数据的大量性(Volume):改变审计抽样分析方法。
大数据的大量性让审计可以即全面又高效地对所有数据进行分析处理,让鱼与熊掌兼得。以往的审计工作中多采用抽样分析法抽取数据库中的数据样本进行审计,以此提高审计效率。但这其实是一种妥协,是在效率与效果两者间权衡利弊后的结果,这样的分析方法同时也为弄虚作假提供了生存的空间,产生了审计风险。而大数据分析如一台最精细的扫描仪对数据进行全面的扫描从而发现并筛选出最细微的漏洞。运用大数据模型,通过分析对报告中的异动进行预警。在大数据时代,不再依赖抽样分析,可以收集和处理整体的所有数据。19世纪以来,当面临大的样本量时,人们都依赖于抽样分析。但是,抽样分析是由于信息缺乏和取得信息受限制的条件下采用的一种方法,这其实是一种人为的限制。如今,科学技术条件已经有了很大的提高,虽然人类可以处理的数据依然是有限的,但是可以处理的数据量已经大量增加,而且未来会越来越多。
统计抽样其实只是为了在条件和技术受限制的特定时期,是在不可能收集和分析全部数据的情况下的选择。统计抽样本身存在许多固有的缺陷,它的效果依赖于抽样的绝对随机性。但是,实现抽样的绝对随机性非常困难,一旦抽样过程中存在任何偏见,分析结果就会相距甚远。随着大数据分析取代了抽样分析,社会科学不再单纯依赖于抽样调查和分析实证数据,现在可以收集过去无法收集到的数据,更重要的是,现在可以不再依赖抽样分析。
(二)大数据的多样性(Variety):大数据能极大地拓展审计的数据来源,审计数据不再局限于被审部门与相关业务部提供的数据。之前数据二次挖掘产生的新数据与一些边缘数据都将是审计用以审查的数据来源。通过专业的识别系统辨别关键人员及其行为,并对其进行编号储存以便检查。
(三)大数据的时效性(Velocity):审计关口的前移是审计未来的发展趋势,审计的时滞性将会越来越小,及时审计甚至实时审计将越来越重要,大数据的时效性就能很好的将审计由事后监督转向事中控制与事前预警。数据的采集与数据库的建立是审计工作的一个重要环节,而目前数据的采集方法一般分为两种:一是由被审计部门按审计要求收集、分类、汇总后上传审计部门的数据库;二是由审计对象将所有数据上传审计部门数据库后由审计部门进行分类与汇总。这两种方法都会在一定程度上造成时间与金钱的浪费。而大数据分析可以通过云计算技术将数据的初步处理与分析分散到众多的前台操作终端上进行,化繁为简、化大数为小数,省去了前期机械且低效的劳动。
(四)大数据的价值性(Value):大数据对审计工作的价值主要体现在三方面:
1. 帮助审计部门提升审计效率。通过计算机进行数据的收集与初级分析,可以有效的缩小审计数据的范围减少无谓的机械劳动对人力的消耗。解放劳动力让审计工作人员可以将更多的精力投入到那些需要人为判别认定的问题上去。
2. 改善审计整改落实情况。审计发现问题的整改落实一直是审计工作的难点。往往审计部门发现问题后相关部门进行一定的处罚后便不了了之,未能起到其应有的作用。运用大数据技术可以统计出反复出现的审计问题并对问题进行分析,再与相关部门进行沟通并从根源上解决问题,甚至为部分滞后的制度和操作流程修改提供数据支撑。
3. 拓展审计报告内容,为管理者提供有效建议。因审计工作的特殊性相对于其他部门拥有更好的独立性与综合性,审计部门能更全面更综合地掌握其他部门所未掌握的信息。大数据拥有出色的数据挖掘能力,而审计部门结合其数据的特性,运用大数据不仅能更好发现被审计对象的问题,还能为行社开发设计符合客户需求的产品与更好地满足客户的有效需求提供精准有效的建议。
三、“大数据”时代的审计方法展望
(一)开展数据基础式审计
以审计工作目标为导向,以数据为基础,按照“总体分析、重点审计业务分析、重点审计事项分析”逐层深入的思路,以“三个坚持”为原则,即坚持数据分析必须以审计业务需求为核心、坚持数据分析对审计实践的指导、坚持审计实践对数据分析的推动,运用信息系统审计技术方法全面分析被审计单位信息系统在建设运行过程中存在的缺陷和不足,明确数据分析的思路和方法,开展数据基础式审计,为审计工作的顺利开展提供技术支持和数据保障。
(二)运用总体审计模式
传统的抽样审计模式,由于抽取样本的有限性,而忽视了大量的业务活动,无法完全发现和揭示被审计单位的重大舞弊行为,隐藏着严重的审计风险。在大数据时代,数据的跨行业、跨企业搜集和分析,可以不用随机抽样方法,而采用搜集和分析被审计单位所有数据的总体审计模式。大数据环境下的总体审计模式是要分析与审计对象相关的所有数据,使得审计人员可以建立总体审计的思维模式。
审计人员实施总体审计模式,可以规避抽样审计风险。审计人员能够收集总体的所有数据,就能看到更细微、深入的信息,就可对数据进行多角度的深层次分析,从而发现隐藏在细节数据中的对审计问题更具价值的信息。审计人员实施总体审计模式,能发现从抽样审计模式所不能发现的问题。总体具有局部根本没有的功能,当各个局部以合理的结构形成总体时,总体就具有全新的功能,总体的功能就会大于各个局部功能之和。大数据技术给审计人员提供了一种能够从总体把握审计对象的技术手段,从而帮助审计人员能从总体的视角发现以前难以发现的问题。
(三)综合运用审计成果
目前,审计人员的审计成果主要是提供给被审计单位的审计报告,其格式固定,内容单一,包含的信息较少。随着大数据技术在审计中广泛应用,审计人员的审计成果除了审计报告外,还有在审计过程中采集、挖掘、分析和处理的大量的资料和数据,可以提供给被审计单位用于改进经营管理,促进审计成果的综合应用,提高综合审计成果的应用效果。
审计人员对大数据技术的应用,促进了审计成果的进一步综合应用。首先,审计人员通过对审计中获取的大量数据的汇总、归纳,从中找出内在规律、共性问题和发展趋向,为被审计单位投资者和其他利益相关者提供数据证明、关联分析和决策建议。其次,审计人员通过应用大数据技术,从不同的角度、不同的层面整合提炼以满足不同层次的需求。再次,审计人员将审计成果进行智能化留存,通过大数据技术,将问题规则化并固化到系统中,以便于计算或判断问题发展趋势。最后,审计人员将审计成果与被审计单位进行关联,可以减少实地审计的时间和工作量,提高审计工作的效率。
(四)从精确的数字审计向高效的数据审计发展
直到今天,审计人员的数字审计技术依然建立在精准的基础上。这种思维方式适用于掌握“小数据量’的情况,因为需要分析的数据很少,所以审计人员必须尽可能精准地量化被审计单位的业务。相比依赖于小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助审计人员进一步接近事情的真相,“局部”和“精确”的将不再是审计人员追求的目标,审计人员追求的是事物的“全貌”和“高效”。
在大数据环境下,传统的很多审计技术和方法显得效率低下和无法实施,大数据时代的超大数据体量和占相当比例的半结构化和非结构化数据的存在,已经超越了传统数据库的管理能力,必须使用新的大数据存储、处理和检索方法。围绕大数据,一批新兴的数据挖掘、数据存储、数据处理与分析技术将不断涌现。在实施审计时,审计人员应使用分布式拓朴结构、云数据库、联网审计、数据挖掘等新型的技术手段和工具,以提高审计的效率。
四、适应大数据审计的应对措施
(一)普及“大数据”的概念
提到“大数据”这个词,很多人都认为其就是在审计工作中收集的被审计企业的大量电子信息数据,诸如财务账套信息、业务流水信息等。严格来说,大数据有数据体量巨大(volume)、数据类型繁多(variety)、价值密度低(value)、处理速度快(velocity)四个特征。在“4V”特征基础上,对“大数据”的含义较为精炼的概括是:基于多元异构、跨领域关联的海量数据分析所产生的决策流程、商业模式、科学范式、生活方式和观念形态上的颠覆性变化的总和。诸如网络日志、视频、图片、地理位置信息等等都是我们需要分析的大数据类型。
简单来讲,“大数据”应用的核心是分析技术,其主要涵盖了以下五个方面:一是可视化分析。数据可视化就是让数据自己说话,让用户直观的感受到结果。二是数据挖掘算法。使用分割、集群、孤立点分析等算法精炼数据,这些算法一定要能够应付大数据的量,同时具有较高的处理速度。三是预测分析能力。预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。四是语义引擎。语义引擎需要设计到有足够的人工智能,让其足以从数据中主动地提取信息。五是数据质量和数据管理,透过标准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。
正所谓“磨刀不误砍柴工”,只有弄清“大数据”的本质才能有效开展工作,因此普及“大数据”的概念是开展后续工作的基础。大数据环境下的审计不仅仅是数据量的大规模和数据计算的快速,更重要的是它能够实现对审计对象的各个侧面进行更多的数据描述,可以实现从整体视角对审计对象进行较为全面立体式多角度、多维度数据分析,从而更有利于提高发现问题的概率、提高审计效率、降低审计风险。大数据技术给国家审计带来了以下积极影响:一是大数据将提升国家审计对经济社会风险预警能力;二是大数据将是国家审计的重要战略资源;三是大数据将带来基于全数据模式的审计思维变革;四是审计大数据分析将是国家审计重要战略技能。
(二)做好“大数据”审计的基础工作
1.制定国家审计领域“大数据”技术应用长期发展战略。“大数据”审计是一项广泛涉及到技术和业务的复杂系统工程,必须在长期发展战略指导下有计划、有步骤地实施。在战略框架指导下,审计机关要从数据、人才和技术等方面逐步积累基础资源,才能真正实现大数据技术在国家审计领域的有效运用。
2.加强国家审计领域“大数据”技术应用相关法规建设。“大数据”采集、存储的制度化、规范化,以及审计大数据分析结果及相关电子证据的法律地位,都是审计法要解决的问题。而大数据等审计信息化技术应用的立法是一项复杂的、技术性很强的法律系统工程,应该以系统的观点进行研究,按照循序渐进的原则予以完善。
3.建立国家层面的审计大数据分析平台。一是充分利用审计机关获取的各方面数据,真正建立集中统一的中央企业数据库,其中应包括被审计单位的时间序列的历史财务、业务数据和所处的行业数据。二是在数据库基础上建立集中统一的数据库分析平台。审计机关应加大对大数据技术的研究和开发力度,整合大量简单易用的大数据分析工具,形成一个大数据分析平台供普通审计人员使用。三是在大数据技术基础上建立集中统一的审计管理和决策平台。充分利用大数据平台的数据,创新应用机器学习等各项商务智能技术,提高审计管理和决策水平。
4.加强审计大数据分析模型和软件的研究开发。审计大数据分析平台能够真正在国家审计领域发挥作用,关键是要有一批能够切实解决实际问题的发掘数据分析模型或系统化的软件。为了满足审计人员数据分析和审计管理的要求,审计机关应在审计数据中心的基础上,充分利用云计算、数据挖掘、地理信息系统等技术构建综合数据分析和管理平台,提高大数据技术的应用水平。
(三)提升审计人员业务能力,适应大数据审计要求
利用大数据辅助审计,不仅对审计人员的业务素质提出了要求,还要求审计人员拥有一定的计算机运用能力。计算机技术日新月异,审计方法也不断创新,所以对审计人员的素质要求也越来越高。审计人员的培训是必不可少的。一是建立审计人员培训制度,保证审计人员定期进行学习,确保审计人员能力上与时俱进;二是搭建审计人员学习交流平台,方便大家在线分享经验与答疑解惑;三是注重计算机技能的培训,提高计算机水平,强化大数据的运用能力。
(四)建立专业的“大数据”分析团队,有效开展数据分析
目前,大数据的分析团队主要是在审计项目开始后,抽调各参审单位的计算机骨干和业务骨干临时组成的,在审计项目中共同完成数据分析工作。虽然这种做法能够完成数据的分析工作,但其效率较低,因为数据分析工作要在一定的时间范围内给出分析结果,时间太长就失去价值,分析结果不能为审计工作提供帮助。同时,也难以对数据进行深入的关联分析,造成相互割裂的数据环境。另外,在宏观分析、制度执行情况分析方面,临时组成的数据分析团队受数据分析软硬件环境、人员知识结构等因素的影响,难以完成系统性、宏观性的分析工作。为此,必须从组织上、技术上保障数据分析的有效开展:
一是建立高效的数据分析团队。大数据技术的应用需要既懂计算机、网络、数据库又懂审计的复合型人才,在加强人才培养的基础上,要解决“两张皮”问题,在原有组织架构基础上,建立由宏观分析专家、行业审计专家、数据分析专家构成的专业的“大数据”分析团队。二是充分应用数据分析发现审计线索。在获取到尽可能全面、详尽的数据基础上,运用审计数据分析的前沿理念和技术,构建数据模型,开展数据分析和数据挖掘,并根据具体的行业政策和实际情况,不断地对数据模型进行优化和修正,结合数据可视化等展示技术,充分发挥大数据环境下综合分析的优势。三是建立数据分析的“先行”机制。提早对繁冗数据开展清洗及预处理等,使数据分析工作提前于审计实施。避免出现审计工作已结束,数据分析仍在进行的情况。
(五)加快联网审计和审计数据中心建设
大数据环境下,数据采集是开展审计工作的前提,审计机关应按照《国务院关于加强审计工作的意见》(国发〔2014〕48号)要求积极推进有关部门、金融机构和国有企事业单位等与审计机关实现信息共享,加大数据集中力度,构建国家审计数据系统。具体是加快联网审计和审计数据中心建设,联网可分步进行、逐步推进,先期与财政、税务、社保等机构联网,逐步扩大到公安、房产、住房公积金、民政、工商、银联等机构。通过建立信息共享机制,制定共享数据的格式和内容,建立以审计机关为中心的联网核查和数据比对系统。
加快联网审计的同时,审计机关应建立各类型审计数据库,包括审计系统人力资源数据库、被审计单位数据库、被审计领导干部数据库、国有资产资源数据库、行政事业单位编制数据库、专项资金数据库、各行业财务和业务数据库等。数据库建设包括原始数据库和标准数据库,原始数据库即为采集的最原始的,不经任何加工的数据,以备核查。标准数据库应按照审计署数据规划的要求,建立标准表,将原始数据采集、转换成标准格式数据进行存储。