对大数据的粗略认识
对大数据的粗略认识
去年在微信订阅中曾见到过一篇介绍《大数据时代》这本书的文章,当时只是匆匆点过,将其作为与IT 相关的文章随意浏览了一下。然而,今年突然之间“大数据”一词开始进入各个行业,引用马云在淘宝十周年晚会上的演讲所说的:大家还没搞清PC 时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。是的,我们正进入真正的大数据时代。
那么,什么是大数据呢?百度百科中是这样解释的:大数据技术(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。我们通过这个定义可以对大数据有个感性的认识。大数据的特征一般以四个V (即Volume 、Variety 、Value 、Velocity )来概括。一是数据体量巨大(Volume )。数据量已经从TB (1TB =1024GB)级别跃升到PB (1PB =1024TB)、EB (1EB =1024PB)乃至ZB(1ZB =1024EB)甚至更高。对数据量大小的感受我们可以用电脑硬盘的容量来体会,我们公司大部分电脑依然只是GB ,只有极个别电脑的容量才是TB ,而对大数据而言TB 只是计量单位的起始。二是数据类型繁多(Variety)。数据类型不再仅是文字、数字等结构化数据,还包括日志、视频、图片、地理位置信息等在内的非结构化数据。三是价值密度低(Value )。因为目标不同,所以不是每个数据都是有价值的,换句话说就是数据冗余度大,只有合理利用数据并对其进行正确、准确的分析,才能充分利用大数据带来的高价值回报。那么如何通过强大的机器算法更迅速地完成数据的价值“提纯”是目前大数据汹涌背景下亟待解决的难题。四是处理速度快(Velocity )。数据流成为高速实时数据流,需要快速、持续的实时处理。对数据处理提出了更高的要求。
大数据时代的到来,引发一场生活、工作、思维的变革。对审计工作就目前来说,国家审计机关已在积极地应对这场变革。无论从大数据的理念,还是从大数据所依托的信息化水平来看,其蓬勃发展都更容易在大规模的事务所中出现。目前,中小所在信息化方面的发展状况和需求仍处于基础阶段。资深注册会计师、南通市注册会计师协会副秘书长刘志耕说:“中小事务所在信息化方面目前最为需要的有两点,一是希望能够有方便、快捷、好使的审计软件,二是希望中注协
能够建立实施风险导向审计的经济信息数据库。”加强行业内的信息化技术的建设与共享是行业成功应用大数据的关键。虽然如此,但我们依然需要去了解大数据给我们的工作带来了怎样的变化。
就目前我们所能感觉到大数据带来的最直接的变化主要有两点:首先是审计环境发生了翻天覆地的变化,财务数据已经成为了审计数据中很小的一部分,而更多的是面对业务数据、网络信息及其他电子数据。其次是审计手段也将由原来的查看EXECL 表进入了操作ORACLE 等大型数据库时代。审计数据在大数据时代种呈现出数据量大、数据类型繁多、数据价值率低和处理速度快等特点。这就为信息化审计提出了新要求:如何更快地适应审计工作环境的变化,转变思维和方法,更迅速、更准确地处理数据,提供数据支持。审计人员必须紧跟形势,积极转变思维,提高审计信息化水平。
在文章的最后,想写一下与本文无关,但与我们的工作及审计软件相关的话题。我们的审计软件与客户公司的财务账套对接时,若直接使用ecpa 独立接口包在客户公司的电脑上取数的话,我们的审计软件基本上不存在什么问题。但若客户公司使用的是用友软件或是金碟软件,且他们提供给我们的是财务账套备份文件,那么在将账套备份文件转换为审计接口文件的时候,需要我们的计算机上安装有相应的SQL 数据库。我们初上审计软件时,大部分的客户公司采用的是单机版的财务软件,我们的计算机上安装的MSDE 数据库足以应对。随着近几年客户公司从会计电算化进入会计信息化,更有些优质客户已经上ERP 系统,而我们的计算机上仍只是MSDE 或者SQL2000版本(win7系统的计算机已对这两个版本不兼容),这类低版本的数据库已不能支持客户公司的账套备份文件转换为审计接口文件。而由于高版本的SQL 数据库的安装对于非专业人员有一定难度,且无程序安装包。目前在工作中若遇到用友或金碟高版本的账务备份文件时,基本上是将账套备份文件发给ecpa 宁波或江苏的维护人员由他们代为转换,这样一定程度上降低了我们的工作效率。那么是否可以考虑给每个项目组安装一个高版本的SQL 数据库软件?