试论抽样误差

03-07

作者：秦哲勇

当代经济科学 1995年05期

　　一、抽样调查误差与抽样误差

　　在社会经济统计中将调查结果所得的统计数据与被认识的总体的真实数据之差称为调查误差。抽样调查方式所产生的调查误差则称为抽样调查误差。

　　抽样调查误差按其产生的来源可分为登记性误差、系统性误差和代表性误差三部分。其相互关系可表示如下：

　　登记性误差是指调查统计过程中由于测量、登记、抄录、计算错误以及被调查者申报不实、调查者的有意篡改等主客观原因所产生的调查结果与调查对象真实情况之间的误差。这部分误差是所有调查方式都有可能产生的一种误差，抽样调查这种方式也不例外。

　　系统性误差是指调查过程中由于计量器具失准、人为的心理倾向而使调查结果出现偏高（多）或偏低（少）的一种误差。所以也称为偏差。这部分误差与抽样调查并没有必然的联系。只要组织工作和宣传工作做得好，不违背随机原则，系统性的偏误是可以预防和基本消除的。

　　代表性误差是指调查过程中由于所调查的只是总体的一部分单位而不是总体的全部单位所产生的样本指标与总体指标在数值上的差别。这部分误差是抽样调查这种方式所固有的，只能减少而不可避免和彻底消除的一种误差。要彻底消除这种误差，只有一个办法，那就是把所要调查的单位数增加到与总体单位数一样多。不过那时，也就不叫抽样调查而叫全面调查了。正由于这种代表性误差是抽样调查这种方式所固有的，所以统计理论中便将抽样调查误差中的代表性误差称为抽样误差。

　　通过以上分析，我们可以得出如下三点结论。

　　1.抽样误差和抽样调查误差是既有联系又有区别的两个概念而不是一个概念。

　　2.抽样误差只是抽样调查误差的一部分。

　　3.当登记性误差和系统性误差都等于“0”时，抽样误差就等于抽样调查误差。

　　二、抽样误差的性质

　　抽样误差的大小随着样本的不同而变化。有多少个样本就相应地可以计算出多少个样本平均数或样本成数。每一个样本平均数和总体平均数之间，或样本成数与总体成数之间都会产生或大或小的离差。这种离差可以叫作抽样实际误差。有多少个样本就会计算出多少个抽样实际误差来。

　　就某一次所抽取的具体样本而言，抽样实际误差应该是一个确定的数值。但在总体指标数值为未知的情况下，这个数值是无法计算的。但就整个抽样而言，因为样本是随机抽取的，所有样本都有被抽中的可能性。究竟中选的是那一个具体样本，在调查之前是无法肯定的。因此，样本指标的数值也无法确定其大小。由于样本抽取的随机性，样本指标便成为随着样本的变化而变化的随机变量。抽样实际误差也相应地成为随着样本指标数值的变化而变化的随机变量。在这种情况下，即使总体指标的数值为已知，由于样本指标的数值无法确定，抽样实际误差的数值仍然不可能被计算出来。

　　抽样实际误差虽然不能计算出来，但由于它一方面可以直观地表明抽样误差是个什么东西；另一方面可以揭示出抽样误差所具有的随机性质。因此，抽样实际误差具有重要的理论意义。人们常说，抽样误差是一种随机误差，其实就是指抽样实际误差而言的。

　　三、抽样误差的实质

　　抽样实际误差仅仅表明抽样误差的直观形式而并没有揭示出抽样误差的实质。其实，抽样误差并不是就某一个具体样本而言的抽样实际误差，而是就所有可能样本而言的抽样实际误差的平均值。即抽样平均误差或平均抽样误差。这是因为，虽然各个具体样本的实际误差会随着样本的变化而可能有着种种不同的数值，但所有可能样本实际误差的平均数却永远是一个固定的数值。也正因为它是所有可能抽样实际误差的平均数，所以被称为抽样平均误差或平均抽样误差。不论在抽样理论还是在抽样实践中，都是以抽样平均误差的大小为尺度反映抽样误差的一般水平的。这也正是抽样平均误差被称为抽样标准误的根由。

　　综上所述，我们可以将抽样误差这一概念的内涵作如下概括。即：所谓抽样误差是指假定抽样调查过程中不存在或没有发生登记性误差和系统性偏差的条件下，由于样本抽取的随机性而产生的抽样调查所固有的一种代表性误差。注意这个“假定”条件，对于理解抽样误差有着重要的意义。

　　四、抽样误差的计算

　　抽样误差有直接计算法和间接计算法之分。为了说明抽样误差的直接计算法，我们不妨由样本平均数的标准差讲起。

　　样本平均数的标准差其计算公式可表示如下：

　　公式②表明在重复抽样条件下，样本平均数的标准差；公式③表明在不重复抽样条件下，样本平均数的标准差。它们都等于样本平均数与总体平均数实际误差平方之和的平均数的平方根。而这正是我们所说的抽样实际误差的平均数或抽样平均误差。

　　在上述两个公式中，一方面由于总体指标的数值往往为未知数。另一方面，不论重复抽样还是不重复抽样，其可能抽到的样本个数都相当的多。有人曾经做过计算，若从总体单位数为6000的总体中，随机抽取一个容量为30的样本，在不重复抽样条件下，根据其组合公式计算出的样本可能个数M将为7751×10[77]个。要将这么多样本全部抽取出来，计算其样本平均数实际上是不可能做到的。不用说这还是一个较小的有限总体和小样本呢？至于重复抽样与大样本条件下的可能样本个数其数量之多，读者是不难想象的。

　　显然，上述两个公式只具有重要的理论意义，并没有实际的应用价值。要解决抽样误差的计算问题，还必须另辟蹊径。这就是抽样误差的间接计算法。

　　数理统计也已经证明：

　　公式④所表明的是在重复抽样条件下，样本平均数的抽样误差公式；公式⑤所表明的是在不重复抽样条件下样本平均数的抽样误差公式。有的书上，抽样误差的符号不用来表示，而用来表示，其实两者并无本质的不同。

　　将上述公式中的σ[2]用成数的方差P（1-P）来替换，就可得到重复与不重复抽样条件下，样本成数的抽样误差的计算公式。即：

　　公式④⑤⑥⑦中的总体方差往往也是不知道的，在大样本条件下，往往用样本方差来替换之。上述公式将依次变形为：

　　总之，上述抽样误差的①至（11）个计算公式都是就简单随机抽样或纯随机抽样而言的。至于其他抽样方式下抽样误差的计算都是以此为基础而充实、发展起来的。读者可参阅有关教材，这里不再赘述。

　　五、估计误差与抽样误差

　　估计误差与抽样误差也是一对既有联系又有区别的概念。有必要划分清楚，不得混淆。

　　首先，估计误差是指用样本指标估计相应的总体指标时，其误差可能达到的最大范围或进行抽样设计时，方案中可以接受或能够允许的误差。估计误差的大小可以用样本指标与总体指标离差的绝对值来表示。代表符号为△。为了区别样本平均数的估计误差还是样本成数的估计差，估计误差的符号常常附以不同的下标。因此，样本平均数和样本成数的估计误差其关系式可表示如下：

　　上述不等式表明：

　　1.在有限总体内进行随机抽样，尽管样本指标数值的大小会随着所抽取的样本的不同而有所不同。但其变动都有一定的范围。这个范围的总长度为2△。在这个范围内，样本指标与总体指标离差的绝对值不会超过△。

　　通过抽样调查，样本指数或p的数值是不难得到的。只要我们知道估计误差△的大小，那么，我们虽然不能确切地说出相应的总体指数的具体数值，但表明总体指标数值的变化范围却是可以办到的。这就是估计误差或允许误差这一概念的揭示的理论内涵和表明的现实意义。

　　其次，估计误差的大小往往是根据需要与可能由人们主观设定的。那么如何设计估计误差的大小呢？

　　我们知道，由于样本指标是一个随机变量，而总体指标或P又未知，根据估计误差的定义公式是无法直接求得估计误差的具体数值的。我们不妨用抽样误差或σ[,P]为尺度，对估计误差或△[,p]，进行度量或测定。或者说，我们可以将估计误差（或△[,p]）与抽样误差（或σ[,p]）进行对比，其比值是可以求得的。假定其比值为“Z”，则估计误差与抽样误差之间将存在如下关系。即：

　　也就是说，估计误差虽不能直接根据定义公式进行计算，但它可以用抽样误差的“Z”倍来表示。在求得抽样误差的基础上，只要将抽样误差乘以“Z”，估计误差就可以被测算出来。作为衡量估计误差的尺度或标准，正是抽样误差的重要用途之一。

　　从估计误差与抽样误差的关系式可以看出，估计误差的大小不仅受抽样误差大小的影响，同时还受“Z”值大小的制约。在抽样误差一定的条体下，估计误差的大小将由“Z”值的大小来决定。那么“Z”究竟应做何解释呢？“Z”在抽样设计中被称为概率度。它是衡量估计可靠程度的一个重要尺度。它和概率既有区别又有联系。区别在于“Z”的取值可以是任意实数，而概率的取值只能在“0”与“1”之间。其联系在于概率度与概率具有函数关系。即对应于不同的Z值，将有不同的概率F（Z)与之对应。求概率度的过程，正是把样本指标所服从的一般正态分布转化为标准正态分布的过程。经过这种变换，有了概率度“Z”，我们就可以依据标准正态分布概率积分表求出与概率度Z（标准正态随机变量）相对应的概率F（Z)的值来。

　　再次，估计误差与估计的精确性和可靠性之间存在着密切的关系。

　　就估计的精确性来看，因为估计误差所表明的是用样本指标对相应的总体指标进行估计时，总体指标变动的可能范围而不是一个确切的误差数值。这一范围的大小是用Z倍的抽样误差即Z来表示的。在概率度Z值一定的条件下，抽样误差越小，估计误差的范围也就越小。可见，估计误差范围的大小与抽样误差的变化成正比关系；而估计误差范围越大，表明用样本指标估计相应的总体指标时，总体指标的变化范围也就越大，而总体指标变化范围越大，意味着对总体指标的估计越不精确。可见，估计误差范围的大小与估计的精确性成反比关系。要提高抽样估计的精确性，就必须缩小估计误差的范围。在概率度Z一定的条件下，要使估计误差范围缩小，其唯一的办法就是减少抽样误差。

　　就估计的可靠性而言，当抽样误差值一定的条件下，估计误差范围的大小与概率度Z从而与Z的函数值F（Z)即概率的变化成正比关系。即估计误差越大，Z值越大，Z的函数值F（Z)也就越大；反之，估计误差越小，Z的函数值F（Z)也就越小。也就是说，估计误差越大，当以样本指标估计相应的总体指标时，总体指标落在该误差范围的可能性也就越大，从而估计的结果也就越可靠；反之，估计误差越小，当以样本指标估计相应的总体指标时，总体指标落在该误差范围内的可能性也就越小。从而估计结果也就越不可靠。

　　总之，估计误差范围的大小与估计结果的精确性成反比，而与估计结果的可靠性成正比。要提高估计的可靠性，必须增大估计误差，而估计误差的增大，势必降低其估计的精确性；反之，要提高估计的精确性，就必须缩小估计误差，而估计误差的缩小，势必降低其估计的可靠性。我们不能要求设计的抽样方案，既具有最高的精确性，又具有最大的可靠性。这是永远办不到的。我们只能依据调查的目的确定出适当的精确性和必要的可靠性。能够使估计误差的变动范围处于人为的控制之中，正是随机抽样所具有的最大的优越性之所在。也是现代统计学理论研究所取得的重大成果之一。

　　值得注意的是，我们在这里不说估计的准确性而说估计的精确性。其用意在于，准确性往往指统计数字偏离于真实的总体均值的大小；而精确性则指统计数字偏离于反复使用同一抽样方法所获得的样本均值的大小。由于总体均值往往是未知的。所以，用精确性比用准确性似乎显得更确切一些。

作者介绍：秦哲勇陕西财经学院统计系副教授

与《试论抽样误差》相关的范文

07-09 检验化验制度

检验化验制度第一条样品的抽取、制备、保管 1、质管员要根据规定，对原料、成品进行抽样，并及时将样品送给化验员进行化验，质管员在抽样时需将样品名称、生产时间、抽样时间，到货数量等信息在请验单上进行明确标识。 2、化验员根据质管员提供的样品，进行四分法分样后，将需粉碎的样品进行粉碎，全通过40目筛，用于化验，不需粉碎的，直接用于化验。 4、将不需化验的样品放入留样室进行保管，定期清理。第二条样 ...

08-21 **省第一次经济普查数据质量抽查实施办法

　　　　一、为做好**省第一次经济普查数据质量抽查工作，根据国务院《第一次全国经济普查数据质量抽查实施办法》和《**省第一次经济普查实施方案》的要求，特制定本办法。　　二、数据质量抽查的目的是检查各市经济普查数据质量，评估全省经济普查数据质量。　　三、数据质量抽查的组织实施与人员抽调要求　　（一）**省经济普查领导小组办公室从省和各市抽调人员，组成11个省级数据质量抽查组，负责各市的数据质量 ...

04-10 公司各种岗位责任制度

公司各种岗位责任制度一行政部职责 1.负责公司日常事务性工作，对总经理负责。 2.负责建立健全公司的各项管理制度，并印发执行，对执行情况实行跟踪考核。 3.负责会务安排、人员接待及公司的对外宣传工作，树立良好的公司形象。 4.做好人力资源的档案管理工作。 5.做好部门考核和公司员工薪酬及奖金的核定工作。 6.加强内部管理，做好公司各类资料的收集整理、归档工作。 7.做好请示汇报和部门之间的沟通 ...

10-12 生产部门岗位责任制度(齐全)

岗位责任制度行政部职责 1.负责公司日常事务性工作，对总经理负责。 2.负责建立健全公司的各项管理制度，并印发执行，对执行情况实行跟踪考核。 3、负责会务安排、人员接待及公司的对外宣传工作，树立良好的公司形象。 4.做好人力资源的档案管理工作。 5.做好部门考核和公司员工薪酬及奖金的核定工作。 6.加强内部管理，做好公司各类资料的收集整理、归档工作。 7.做好请示汇报和部门之间的沟通协调工作。 ...

12-08 市监察局重点工程监督情况汇报

　　7中旬，XX市纪委、监察局牵头组织了一次对20XX年重点工程抽查，我们邀请了启东市誉佳市政试验有限公司的工程技术人员，抽借了财政局2名工程资金专管员，组织了5名水利、桥梁、道路三个专业的监督员，对年初确定的十一个重点工程实施了抽查，现把抽查监督的主要情况作一汇报：　　一、精心组织定方案。今年初，市委徐永兵书记、市长汤仲飞在多次会议上强调“要加强工程建设招投标活动的监管”，为此，我们纪委、监察 ...

10-19 产品质量管理办法和各部门岗位职责

产品质量管理办法和各部门岗位职责 1主题内容与适应范围本标准规定了总则.管理体系.岗位职责.三检制度.质量标准,评比标准.考核办法.奖惩办法等. 本标准适用于西北师大印刷厂产品质量管理工作. 2总则 2.1为了用精美的印刷产品丰富社会文化和人们的精神生活,提高企业在社会上的知名度和市场竞争能力.全体职工要树立"质量是企业的生命"的思想和全面质量管理的意识,从而建立全面的质量管 ...

08-06 观摩课体会:从课堂教学看"用教材教"

观摩课体会：从《误差》课堂教学看“用教材教” 教学实录：环节1：学生用手中刻度尺测量物理课本的宽度。说说测量中遇到的问题和测量的结果。生1：遇到的问题是直尺不够用（注：一次不能测出结果），测量结果为18.4cm。生2：遇到的问题是直尺不够用，测量结果为18.5cm。生3：遇到的问题是直尺不够用，用分段测量的办法，测出的结果为18.45cm。生4：遇到的问题是终端不是完全与直尺的分度值吻合 ...

01-10 工程测量的社会实践报告

工程测量的社会实践报告这次寒假实践，我到了我们当地的建筑工地，因为有亲属在那里，仪器也算是齐全。那里地势较为平坦，地貌相对简单，但在这实习的十多天里还是体会到了从未有过的艰辛。现在细细想来，那十多天的经历，虽然艰苦，但却学到了很多，不仅仅是测量的实际能力，更有面对困难的忍耐。说实话，，在最初几天的新鲜感过后，每天重复而乏味体力劳动，让我有些怨声载道，但工程本身的性质又不允许工期的延后，所以不得不 ...

03-11 工程测量实习报告

一．实习时间：。。。。。。。。。。二．实习地点：。。。。。。。。。三．小组成员：组长：。。。。；组员：。。。。。。。。四．指导教师：。。。。。。。。。。五．实习目的：实习是工程测量教学的重要组成部分，除验证课堂理论外，还是巩固和深化课堂所学知识的环节，更是培养学生动手能力和训练严格的科学态度和作风的手段。通过控制网的建立、地形点的测绘、手绘成图等，可以增强测绘地面点的概念，提高解 ...

12-04 高效液相色谱仪验证方案

高效液相色谱仪验证方案验证文件类别：技术标准编号：V-A-c-004-0 部门：验证委员会页码：共1页，第1页高效液相色谱仪验证方案版次：¨ 新订 ¨替代：起草：年月日部门审核：年月日审阅会签：（验证委员会）批准：年月日实施日期：年月日复印数：批准：分发至：目录 1.设备基本情况 1.1概述 1.2基本情况 3职责 3.1验证委员会 ...

随机推荐

猜你喜欢

试论抽样误差

·营养片促销策划方案

·国庆节文艺节目主持词

·师德先进个人简要事迹

·优秀团员主要事迹例文

·关于市旅游发展情况及发展思路的报告

·市长在三级干部专题会致辞

·教师集资建房申请报告

·春节期间食品安全整治电视电话会议的省农村食品安全专项整治讲话稿

·幼儿园惩罚教育心得体会

·初二英语:提前知道这8大易错点,新学期学习英语更容易!更轻松

·大酒店开业庆典策划

·在XX县树立和落实科学发展观暨转变干部作风大会上的主持辞

·社区义诊活动方案

·香溪源导游词

·总裁助理竞聘演讲稿

·等差数列与等比数列通项公式

·十一国庆向国旗敬礼网上签名寄语2015

·物美卜蜂莲花合作告吹背后有什么

·一般现在时的句子转换:句式之间的转换

·开辟"蓝海"新战场