抽样调查论文

04-28

等概率整群抽样在实际中的应用

——基于河南省滑县玉米总产量的估计

小组成员许丽勤刘梦玲陈雪郑淑花

年级 2013级专业应用统计系（院）统计与数学学院

指导教师马云玲

2013年12月7日

等概率整群抽样在实际中的应用

——基于河南省滑县玉米总产量的估计

1．研究背景

河南省滑县现隶属于河南省安阳市，2014年1月1日起开始脱离安阳市改

由河南省直接管辖。滑县地处豫北平原，是中原经济区粮食生产核心区、河南省第一产粮大县、全国唯一的粮食生产先进县标兵“十连冠”，素有“豫北粮仓”之称，农作物以小麦、玉米为主。而河南是“中国粮仓”、“国人厨房”，是中国小麦、玉米、棉花等农产品的重要生产基地，选取以滑县为代表的河南省的粮食产量尤其是玉米产量的研究对预测全国的粮食产量总水平具有重要意义。本文以抽样技术理论为基础，通过从滑县23个乡中随机抽取10个，调查这十个乡的玉米产量，并运用不同的抽样技术来估计滑县玉米的总产量，最终权衡各技术，得出估计总产量的最优方法，以便指导以后的工作进行。

2. 理论依据

整群抽样是将总体划分为若干群，为减少抽样误差，在划分群时应使得群内各单元之间差异尽可能大，以避免同一群内各单元提供重复信息，群与群之间各单元的差异尽可能小。然后以群为抽样单元，从总体中随机抽取一部分群，对入选群内的所有单元进行调查的一种抽样技术。

本文主要研究对滑县玉米总产量的估计，考虑到各个群（乡）的单元数不同，因此采用不等规模下等概率整群抽样的方法。等概率整群抽样不考虑各个群规模的大小，都赋予同样的权重，因此每个群被抽中的概率都相等，也就是按照等概率的原则随机从总体中抽取若干群进行调查。主要假定在N个PSU（初级抽样单元）组成的总体中，第i个PSU包含Mi个SSU（二级抽样单元）。对于整群抽样而言，被选中的群（PSU）中所有的SSU全部入样，因此Mi=mi 。在此，主要考虑两种方法：无偏估计和比估计。

2.1 等概率抽样的简单无偏估计

等概率抽样的无偏估计基本思想是，以群规模Mi为权数，乘以各群均值



，

得到群观察值总值i，再将样本中n个群的群总和平均，求得群总和均值y，再

除以群平均规模M



M

i1

NMiyinM



，求得均值估计。其估计公式为：





y



1nM



i1

yi

i1





YM0

2.1.1

若总体群平均规模M未知，可用样本平均规模m



M

i1

代替。由于在估计总

体总值Y时需要总体基本单元总数M0，但使用整群抽样往往是因为没有总体中基本单元的抽样框，而由于总体的群数N是已知的。因此，可以用以下公式来对其总体总值及总体方差估计为：

NY



y

i1

2.1.2

(yy)iii1n



N2(1f)

v(Y)



n1

2.1.3

2.1.2 等概率抽样的比率估计

其基本思想是，我们通常预期群内各单元取值yi与各群规模Mi是相关的，因此以Mi为辅助变量，总体均值的比率估计量为：



y

y

i1ni1

M

2.1.4

从比率估计的性质可知，它是一个有偏估计。但当样本群数n很大时，其偏

倚很小，可以忽略不计，认为近似无偏。

其总体总值Y的比率估计和方差估计为：

YM0yM0



y

i1ni1

M

2.1.5

v(Y)



(y(1f)

i1

yi)2



nn1

n2nnN2(1f)122

(yiyMi2yMiyi) 2.1.6 

nn1i1i1i1

3. 实例分析

3.1 变量选择

要估计滑县2013年玉米总产量，我们主要采用以上所介绍的两种方法进行估计，无偏估计法得到抽取各个群体的玉米产量，比率估计考虑辅助变量的选择，辅助变量在选择时要遵循以下原则： 1. 辅助变量必须与主变量高度相关；

2. 辅助变量与主要变量之间的相关关系整体上相当稳定； 3. 辅助变量的总体总值必须是已知的，或是容易获得的； 4. 辅助变量的信息质量更好，或信息更容易取得即调查成本更低基于以上原则，我们主要考虑两个辅助变量：各群规模Mi和种植面积Xi 。

3.2 数据搜集与处理

据了解河南省安阳市滑县有道口镇、留固镇、高平镇等10个镇，枣村乡，八里营乡，大寨乡等12个乡和新区管委会。共726个村，为工作方便起见，现随机从这23个乡（镇、管委会）中抽取十个群体，所抽取到的是道口镇、城关镇、留固镇、万古镇、上官镇、赵营乡、老庙乡、桑村乡、瓦岗寨乡，新区管委会，

共209个村。共有800块农田种植玉米，我们通过实割实测的方法，得到抽取到的各个群体玉米产量yi及各乡种植面积xi显示在表1中。该县2013年玉米总种植面积为30525亩。由于时间及经费有限，为估计2013年该县的玉米总产量，现采用等概率抽样抽出10个乡进行该作物的产量调查。具体调查数据如下表

表1 滑县10个乡（镇）的调查数据

（1）无偏估计法

由表3.1及式（

2.1.2）可以估计出滑县的玉米总产量，结果如下：

Nn33

Yyi(22.023.6)848.43(万公斤)

ni110

(3.1)



此处，我们利用估计量的标准差来衡量其精度。由式（2.1.3）可知，要计算出群规模不等的无偏估计的标准差，需要先计算出样本均值和总量估计值的方差，最后开方得到玉米总产量估计值的标准差。计算结果如下：

yyi25.71(万公斤)

ni1

(3.2)



V(Y)



(y

(1f)

i1

yi)2



nn1



3320.69720.6571567.9 (3.3)

s(Y)39.6 (3.4)

（2）比率估计法

由表中的数据可得出关于玉米产量yi 、乡村庄数yi 及种植面积xi 之间的

变化趋势图，如图3-1所示，由于量纲的影响，为了更清楚的显示出三者之间的关系，将种植面积用百亩表示的数据显示到图中。

图1

从图中可以看出，乡玉米产量与村庄数和乡种植面积相关程度比较大，为了更进一步说明它们之间的相关关系，我们用变量之间的简单相关系数来说明。简单相关系数是用以反映变量之间相关关系密切程度的统计指标。简单相关系数

r的数学表达式为：

(x

x)(yiy)



我们通过计算相关系数可以得到，

乡玉米产量与村庄数和乡种植面积的相关系数分别为0.9498和0.9590。且图中显示它们的相关关系比较稳定，说明我们选择村庄数和乡种植面积作为辅助变量是合理的。

1）以群规模为辅助变量

由于每个

乡的玉米总产量与该乡的村庄数有关，即与群规模

r

(x

x)(yiy)



因此，可用以群规模作为辅助变量的比率估计

来估计孟津县的玉米总产量。根据式（2.1.5）可以得出：

YM0



y

i1

ni1

726

M

257.1

893.万公斤08(209

)

(3.5)

其中，M0为总村庄数，即M0Mi。

i1

此处，我们利用估计量的标准差来衡量其精度。由式（2.2.6）可知，要计算出群规模不等的比率估计的标准差，需要先计算出总量估计值的方差，最后开方得到玉米总产量估计值的标准差。其计算结果如下：

(y(1f)

i1n

V(Y)



Miy)2





n1

3320.697

9.061687.8 (3.6)

s(Y)26.2(万公斤) (3.7) 2）以种植面积为辅助变量的比率估计法

通过分析可知，影响玉米总产量的因素除了村庄数（群规模）Mi以外，还有种植面积xi,且种植面积与玉米总产量的相关性更强。因此，我们利用种植面积xi代替群规模Mi来作为辅助变量进行比率估计。

已知全县的玉米种植面积为X30525亩，则用xi作为辅助变量的比率估计的计算结果如下：

YX



yx

i1i1

XR3052

257.1

8940

877.85（万公斤） (3.8)

此处，我们利用估计量的标准差来衡量其精度。由式（2.1.6）可知，要计算出群规模不等的比率估计的标准差，需要先计算出总量估计值的方差，最后开方得到玉米总产量估计值的标准差。其计算结果如下：

v(Y)



(y

(1f)

i1

Rxi)2



n1

3320.69715.158127.84 (3.9)

109

s(Y)11.3(万公斤) (3.10)

4. 结论

通过以上的分析计算，我们可以得出群规模不等的无偏估计、以群规模为

辅助变量的比率估计和以种植面积为辅助变量的比率估计的玉米总产量估计值及其标准差，其中玉米总量估计值分别为848.43万公斤、893.03万公斤、877.85万公斤，玉米总量估计值标准差分别为39.6万公斤、26.2万公斤、11.3万公斤。比较三种估计方法可以得出以下结论：

第一，用群规模不等的无偏估计法来估计玉米总产值虽然可以获得无偏估计量，但其估计方差与yi之间的差异有关。因此，该方法适用于yi之间差异不大的整群抽样。

第二，群规模不等的两种比率估计中，以种植面积为辅助变量的比率估计精度比以群规模为辅助变量的比率估计更高。这与比率估计的基本性质有关，即在选择比率估计的辅助变量时，辅助变量必须与主要变量高度相关，由相关系数的值可以知道虽然村庄数即群规模与种植面积均与主变量玉米总产值有高度的相关关系，但种植面积与玉米总产值的相关关系更密切。我们所选择的辅助变量是合理的。因此，以种植面积为辅助变量的比率估计精度更高。

第三，通过三种方法比较可以得出，以种植面积为辅助变量的比率估计的估计效果最好，玉米总产值估计效果更接近真值，以群规模为辅助变量的比率估计的精度次之，估计误差最大的是无偏估计。这是由于以群规模为辅助变量的比率估计，其估计方差取决于群均值Yi的差异。Yi的差异比Yi的差异更稳定。因此，以群规模为辅助变量的比率估计要比无偏估计法获得更好的估计效果。另外，由于玉米乡产量yi与玉米种植面积关系更密切，即与(yiMiy)2相比，

i1n





(y

i1

Rxi)2更小。故以种植面积为辅助变量的比率估计更优于以群规模Mi为



辅助变量的比率估计。但比率估计是有偏估计，它更适用于样本群数n较大的情况。在使用比率估计时，不仅要掌握辅助变量X的总体信息，更需要在调查中获取与目标变量关系更密切的辅助变量资料，从而降低比率估计的估计误差，使估计效果更好。

与《抽样调查论文》相关的范文

01-19 怎样写生物与环境科技小论文

怎样写生物与环境科技小论文生物科技小论文，就是青少年通过自己或与同学一起通过观察、试验、调查等获得的事实材料及逻辑推理来描述科学研究的小文章。生物科技小论文不同于学术论文、长篇大论，贵在“小”，研究的范围小、层次低，论题小、文字少、篇幅短，一般20xx-5000字为宜，具有生动、活泼，反映青少年的特点和语言。生物与环境科技小论文的特点，一是“小”。同正规学术论文相比，科技小论文的选题较小，内容 ...

04-01 集中实践性环节实施方案

集中实践性环节实施方案依据“江西广播电视大学人才培养模式改革与开放教育试点”汉语言文学专业本科集中实践环节教学实施细则，结合我市电大实际，对汉语言文学专业本科集中实践环节作如下安排。一、教学实习　教学实习为3学分，不得免修。（一）教学实习是“中央广播电视大学人才培养模式改革与开放教育试点”汉语言文学专业本科的集中实践环节之一。教学实习必须在修完汉语言文学专业80%的主干专业课程之后进行。（二 ...

06-28 调查报告及论文.总结文字要求

调查报告及论文、总结文字要求一、封面填写要求封面要求打印好后再手写填写。二、调查报告要求（一）调查报告写作的格式 1.须注明调查的对象、时间、地点，范围和主题，以及调查的主要方法。 2.须将调查到的事实材料进行归纳、整理，并依据事实材料的分析研究，得出符合逻辑的、具有说服力的结论。 3.须针对调查得到的事实，提出具有见地的看法或有价值的建议，以期对今后工作提供参考，发挥社会调查报告应有的社 ...

02-13 如何撰写毕业论文

　　本科专业（含本科段、独立本科段）自考生在各专业课程考试成绩合格后，都要进行毕业论文的撰写（工科类专业一般为毕业设计、医科类一般为临床实习）及其答辩考核。毕业论文的撰写及答辩考核是取得高等教育自学考试本科毕业文凭的重要环节之一，也是衡量自考毕业生是否达到全日制普通高校相同层次相同专业的学力水平的重要依据之一。但是，由于许多应考者缺少系统的课堂授课和平时训练，往往对毕业论文的独立写作感到压力很大， ...

10-18 中小学教育科研调查报告.实验报告.论文撰写要求

中小学教育科研调查报告、实验报告、论文撰写要求一、教育科研调查报告 1、题目：通过简炼、确切、鲜明的文字概括全篇内容、点明被调查范围。 2、署名：写明研究者的单位和真实姓名。非个人的要求署集体名，并附研究人员名单，但可写上执笔人。 3、引言：简要说明调查的目的、意义、时间、地点、对象、范围、方法、内容等，或提出社会、师生关注和迫切要发解的问题。 4、正文：主体部分。把调查获得的大量材料，经过分析 ...

02-10 电子商务毕业论文实施计划

电子商务毕业论文实施计划一、毕业论文的目的毕业论文是培养学生综合运用本专业基础理论，基本知识和基本技能分析解决实际问题能力的一个重要环节。它是本专业各个先修教学环节的继续深化和检验。通过毕业论文使学生在实际的电子商务系统管理与工程实际中，充分利用所学的专业知识，理论联系实际，独立开展工作，从而使学生具备从事电子商务工作的实际能力。毕业论文的目的具体有：培养学生综合运用所学知识和技能，解决电子 ...

03-16 "思想道德修养与法律基础"期末小论文撰写和评价方案

“思想道德修养与法律基础”期末小论文撰写和评价方案为全面提高《思想道德修养与法律基础》课程教学的实效性，我们把考试与评分方式的改革作为课程教学改革的一个重要方面，并将撰写小论文作为新的考试形式之一，占学科期末总评的20%。为使这一新型的考试方式得以很好地贯彻实施，特制定如下实施方案：一、方案实施的基本要求 1、论文要体现“基础课”课程的属性、特点和要求，要与课程的思想道德教育功能结合，与课程教 ...

11-22 研究性学习结题报告的写作

研究性学习结题报告的写作 ⒈结题报告的一般格式研究性学习的结题报告形式多样，有文献研究、调查研究和实验研究等，但基本格式大同小异，一般由标题、摘要、研究背景、正文、参考文献等部分组成。 ⒈⒈标题标题是课题研究内容的高度概括，在整篇论文中起“画龙点睛”作用。标题名称要注意以下几点：⑴引人注目。题目要新颖，醒目得体，能准确表达研究内容，恰如其分地反映课题研究的广度和深度。切忌“体会”、“浅谈”、“ ...

10-22 共青团理工大学委员会分团委书记会议纪要

共青团理工大学委员会分团委书记会议纪要（第16周） 20xx年12月25日校团委办公室 ---------- 会议时间：20年12月25日下午3:30 地点：团委报告厅会议主持：xx 记录：xx 出席者：校团委机关工作人员、各学院分团委书记请假者：会议事项（1）：xx 1、本周两项主要工作 1） 12月25日（周一）晚上6：30大礼堂，校话剧团专场演出：《暗恋桃花源》 2）12月28 ...

10-22 共青团xx理工大学委员会分团委书记会议纪要

共青团xx理工大学委员会分团委书记会议纪要（第16周） 20xx年12月25日校团委办公室 ---------- 会议时间：20xx年12月25日下午3:30 地点：团委报告厅会议主持：xx 记录：xx 出席者：校团委机关工作人员、各学院分团委书记请假者：会议事项（1）：xx 1、本周两项主要工作 1） 12月25日（周一）晚上6：30大礼堂，校话剧团专场演出：《暗恋桃花源》 2）1 ...

抽样调查论文

·小学班主任教学总结范文

·档案利用制度

·小学毕业留言大全

·道不尽离愁别恨

·物流公司简介范文

·邯郸市市本级城镇职工医疗保险实施办法

·[春笋]教学设计之二

·选做专题(一)--常见的参数方程

·这里最清凉这里最温暖

·2012年浙江省普通高校专升本考试-[英语]真题

·深情守望这块热土

·年终述职报告(现场版)

·校长提高班培训总结

·竞聘物业公司副经理演讲

·公司领导新春贺词

·严歌苓[幸福来敲门]在线阅读

·浅谈设计阶段投资控制

·王阳明带兵

·想飞的乌龟教学设计

·影视广告需求预测分析