统计数据质量控制
如何严格数据质量监控
就某一个专业来讲,控制数据质量的办法最有效途径只有一个:强化审核。审核,既要审,更要核。审是审数据的逻辑性,核是核指标与数据来源资料的一致性。具体说来,主要有以下几个方面:
1.基础台账的建立及查验
统计台账是数据质量的最基本保障。专业台账的建立必须简单易填。调查单位只将最基本的信息,比如收入多少、人数多少、各种能源用了多少等填入即可,而不需要让调查单位对数据进行多次加工(核算)操作,一目了然,简单易懂。
统计台账还必须满足易于查验的要求。台账数据的直接来源就是企业原始记录资料。就一个规范的调查单位而言,一般来讲,制单环节、生产环节、销售环节的相关记录是齐备的,以实现其强化管理,降低成本,实现利润最大化的最终目的。以生产型企业为例,在生产环节必然存在领料记录、退料记录、出入库记录等一系列的原始凭证。
2.基层表数据的把控
与历史数据对比分析。一是与同期数进行比较,包括绝对量指标和相对量指标,根据数据动态趋势、水平变化情况对数据准确度做出基本判断,核定本年上报同期数是否与上年填报本期数一致。二是与上期数据进行比较(时间序列分析),根据指标性质,判断数据是否有误,如时期指标,反映的是一段时期内的总量,在一个报表周期内,不能出现本月数比上月数小的情况。另外,对于跨年度月份数据的审核,要确保指标数据的延续性。
与平均指标对比分析。如农业统计中的人均粮食、人均增加值、各类作物亩产量、各类牲畜产肉率等,能源统计专业中的人均用电量、单位产品能耗、单位产值能耗等数据,工业统计中的劳动生产率等数据,同一地区同一行业应该大体一致,并保持较好的连续性。
与关联指标进行分析。一方面是专业内关联指标的对比。如农业总产值、主要农产品产量、农业产品销售收入之间的比例关系,农作物播种面积与农作物产量之间的关系,计算农业总产值时主产品产量和价格在变化趋势上的关系等。同一地区主要农产品价格应该大体一样。再如工业统计中的资产应等于负债加所有者权益,产值的增长与用电量的增长应该基本匹配,营业收入和营业利润,营业利润和应交所得税的变化趋势应该基本一致等。另一方面是跨专业指标的对比。如工业生产表中工业产值与能源表中的工业总产值、用电量数据等应该一致,科技统计活动表中的新产品产值应该小于工业生产表中的工业总产值数据等等。
与典型资料进行对比。所谓典型资料,是指通过实地调研获取的真实的、可靠的、具有代表性的资料。我们可以通过了解比较熟悉的调查单位和部门的一些关键数据进行分析评估,如增加值率,主要工业产品的价格、能力、人均工资等,或搞一些小型的抽样调查等办法去分析评估数据质量。
与相关材料的比对。固定资产投资统计、工业企业科技统计等专业涉及的调查内容,与工业统计、能源统计等的内容在较长时间内一直持续存在的特征不同,项目样本更新较快,相关指标与项目的进展不一定存在内在的线性关系,因此在基层数据审核上的有特殊要求。以固定资产投资统计为例:应主要审核项目基础数据是否与文件资料相符,项目填报的新增生产能力名称应该与该项目填报的行业类别相匹配,投资项目的计划总投资应该与填报的新增生产能力规模相匹配,最终实现投资额与计划投资额的差异等。以工业企业科技统计项目为例:应重在核实企业填报数据是否与对应项目立项书的数据相匹配等。
抽查调查单位核实。在进行完历史数据比对等工作后,还需要不定期深入调查单位进行调研、检查、执法等工作,检验调查单位数据上报的可靠性。
3.汇总数据的把控
根据相关指标趋势判定。利用宏观经济指标在反映客观经济趋势对数据进行质量控制。如GDP增长与固定资产投资、工业生产增长存在着较为密切的相关性,可以根据三者的发展趋势进行相互判断。趋势判定还可以运用到分行业数据的判断。从全省层面上看,各个行业之间的发展横向对比可能有快有慢,但同一行业的发展趋势总是维持相对平稳的状态,如果在月度间出现陡升陡降的情况,数据出现问题的可能性较大。
根据经济运行周期判定。长期看,经济发展存在规律。我们可以利用若干年的相关资料,根据动态变动趋势,进行数据质量控制。如观察若干年GDP的增长趋势,了解一个地区经济发展的变化情况,总结出波动规律,以此来预测和判断GDP在一段时期的增长的规律性等。
分析结构比重(例)进行判定。在对各经济指标进行逻辑关系审查的前提下,通过观察总指标与分指标的比例关系,并结合外部经济环境变动趋势,可以大体分析它们所具有比例关系的合理性。如在经济发展正常的情况下,固定资产占GDP的比重应基本稳定,各产业、行业之间的发展也有一个比较稳定的发展比例和趋势。
根据部门数据进行判断。部门数据、行业数据可以作为评估统计数据质量的依据。如工业统计财务汇总数据与财政、税务主要数据的对比,能源统计专业的用电量汇总数据与电力部门数据的对比,农业统计中主要农业产品产量、耕地面积、播种面积与农业、林业、农委等部门数据的对比。
分地区数据协调性判断。分地区汇总审核可以针对数据变动异常的地区进行查询,看这些地区主要受哪些调查单位的影响,这些调查单位的情况是否属实。同时要与其他类似省份(市州、区县)汇总数据进行横向对比。受季度周期影响较大的地区,需与历史数据进行比对。
其他需要注意的问题。一是前文审核数据的各种方法,只是我们平时最常使用的、最简单方便的办法。这些方法并非一层不变,也不是完全独立或相悖,在很多情况下,需要多种方式灵活组合运用,才能发现数据是否存在问题。二是对受生产周期影响较大的企业和行业数据进行判断时,必须结合多年的历史数据资料,不能孤立的判定。三是在对基层数据和汇总数据进行审核的时候,必须要注意到当前经济运行的状态和国家政策走向。如果各个方面反馈的情况都是经济增长在放缓,但汇总出来的数据却高歌猛进,就必须认真核实数据是否可靠。如果国家层面上大力扶持某一行业发展,一般来讲都会带来正面的效应,如金融危机后,国家的4万亿投资项目,很大一部分是投入到基础建设领域,会引导地方基础建设投资项目的快速上马,并在统计数据上得到反映。
4.预测数据的把控
预测未来一段时间经济发展情况,是统计工作的一项重要内容。
预测数据的原则。在统计预测中的定量预测要使用模型外推法,使用这种方法有两条重要的原则:连贯原则和类推原则。连贯原则,是指事物的发展是按一定规律进行的,在其发展过程中,这种规律贯彻始终,不应受到破坏,它的未来发展与其过去和现在的发展没有什么根本的不同。类推原则,是指事物必须有某种结构,其升降起伏变动不是杂乱无章的,而是有章可循的。事物变动的这种结构性可用数学方法加以模拟,根据所测定的模型,类比现在,预测未来。
数据预测的方法。统计预测方法可归纳为定性预测方法和定量预测方法两类,其中定量预测法又可大致分为趋势外推预测法、时间序列预测法和回归预测法;按预测时间长短分为近期预测、短期预测、中期预测和长期预测;按预测是否重复,分为一次性预测和反复预测。
5.历史数据的修正
统计数据可能会因为各种原因出现偏差,本着实事求是的原则,需要对历史数据进行修正。但对历史数据的修正必须本着有据可查、有法可依、材料可溯的原则,不得随意修改历史数据。
统计口径变化后的数据修正。统计口径变化的原因主要来自两个方面,一方面是统计制度会随着经济发展的情况及社会需要进行调整。如工业企业规模以上口径由主营业务收入500万调整为2000万、各行业小类的拆分重组等。因制度变化带来的口径调整,根据制度的最新规定,将历史数据进行重新汇总即可。另一方面是调查单位的调整导致的口径变化。如企业的关、停、并、转等。这种原因带来的调整,需要提供一整套的资料,经认真核实认定有效后,方可调整历史数据。
根据普查结果进行数据修正。抽样调查受样本限制,误差在所难免。普查的数据一般比较准确,规范化程度也较高,因此可以作为调整抽样调查结果的依据。但修正抽样调查的结果,必须由较高级别的统计部门进行或者得到较高级别统计部门授权后方可进行。
发现错误时对相关指标修正。在发现历史数据存在错误时,要视情况决定是否修正。如果历史数据的修正对整个地区数据有较大影响,甚至导致发展趋势的变动,就必须慎之又慎,原则上是不能调整的。如果是年度内数据出现错填漏填情况,在企业和下级统计部门能提供足够证明材料的前提下,可以进行修改。一般来讲,需要企业提供相应指标数据来源的基础资料、加盖公章的数据修正报告、各级统计部门的请示报告等。
灵活运用资源
一是充分利用现有审核软件的功能。目前我们使用的国家一套表软件功能较为强大,既有对基层数据的审核,又有对汇总数据的审核,既有已设定好的数据查询功能,又有可根据需要进行数据的筛选。操作灵活,使用方便。要让这些功能为数据质量控制工作所有。如完成对某些指标人均数的过滤查询、对某些不适合用审核公式表达的内容的查询等等,并将查询结果作为查询和修正数据的依据。
二是根据需要完善软件审核的内容。国家一套表软件在公式设置上,更多考虑的是审核功能的普遍适用,未针对各个地区的特殊情况进行设置。因此,在使用这套程序的时候,要有意识的根据本地的实际情况,增减审核公式,扩大审核范围、收窄审核尺度、提高审核要求,从严控制数据质量。
三是使用常用统计分析软件把控数据。目前我们能使用的最方便的数据初步处理软件是微软的EXCLE。EXCEL集成了较为全面的函数计算公式(包括财务、统计等),能实现我们对数据的常规分析,如绘制各种柱状图、散点图、折线图,完成对数据的筛选、运算甚至预测等功能,可以实现对数据的审核、修订等工作。国家一套表程序集成了导入EXCEL表数据和导出EXCEL表格式数据的功能。在EXCEL表之外,还可以使用市面上常见的统计分析软件,如SPSS、SAS、S-Plus等。
四是建立适应本地区的数据模型。在软件审核之外,还可以通过建立数据模型对汇总数据进行审核把关。如通过计算数据特征值(如反应集中程度的平均值、中位值,反应分散程度的极差、标准差),对基层表数据及汇总表数据进行整体把握。
强化培训和宣传
一是强化业务培训。对数据质量控制的一切操作手段,均是建立在统计人员熟悉和运用统计制度的基础之上的。统计制度就是我们的规范。因此,强化业务培训是提高统计数据质量必然的要求。培训应该有针对性,对报表频次低的专业(如科技统计专业),要在每一个报表期开始前进行一次培训,对报表频次高的专业(如工业统计专业),要及时对统计新人进行培训。统计制度有变化的,也需要及时传达到位,视情况开展培训。
二是加大宣传力度。统计工作需要社会大众的理解和支持。当前,统计工作在社会上的知名度并不高,社会大众对统计工作的流程和指标设置更是不了解,因此难免误解统计数据,怀疑统计工作。要改变这一现状,需要依靠强有力的宣传。宣传要有的放矢,既要宣传统计工作,更要宣传大众关心的统计指标数据的采集和处理过程,同时让社会舆论监督我们的工作,不断提高统计数据质量。
强化专业沟通
建立起专业横向沟通的机制,实现信息共享,形成专业互动的良好局面。
一是强化统计系统内各个相关专业的沟通。如工业、科技、能源专业之间的沟通,名录库与“四上”专业的沟通,只有不断强化统计系统内的专业沟通,破除各自为政的现状,才能及时发现指标存在的问题,确保数据准确有效。
二是强化与其他部门相关专业的沟通。如工业统计与经信、国税、地税等部门的沟通衔接;农业统计与农业、林业等部门的沟通衔接;能源统计与中电联、中石油、中石化等部门或企业的沟通衔接;科技统计与科技、教育、国防科工等部门的沟通衔接。
建立追责机制
建立数据质量追责机制,既要着眼于控制数据源头,也要着眼于防范数据加工过程中可能出现的风险。
一是建立和完善失信行为通报和公开曝光制度。对蓄意编造虚假统计数据,虚报、瞒报统计数据数额较大或者虚报率、瞒报率较高的严重失信企业和严重干预调查单位独立真实报送统计数据的单位、个人,进行公示曝光,并依法追究相关责任。
二是建立数据质量责任追溯制。建立调查单位和统计系统内部的工作交接信息库,督促调查单位完善统计工作交接记录,统计系统内部建立完整工作轮岗及调动记录,确保发现数据质量问题时,能追溯到问题的源头,从而追究相关责任人,这样才能形成长期的、有效的法律威慑力,降低数据质量风险。
数据质量是统计工作的生命,也是服务经济社会发展的重要保障。作为统计工作者,提高数据质量是我们不懈追求的目标、永恒的工作主题、创新的不竭动力。希望前文探讨的对操作层面上的统计数据质量控制办法,能为统计工作能力建设发挥积极的作用。