第二章统计资料的收集.整理与显示
第二章 统计资料的收集、整理与显示
第一节 统计数据的收集
一、统计数据收集的含义和要求
统计数据收集是整个统计活动的基础阶段,通常也称为统计调查阶段。统计数据收集的基本要求是准确性、及时性和完整性。
二、统计数据收集方案设计
统计数据收集方案应包括以下一些内容:
数据收集目的、数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、数据所属时间和数据收集期限、数据收集地点和数据收集的组织。
三、统计数据收集方式
有两种:统计调查方式和实验方式。
(一)统计调查方式
统计调查就是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观对象搜集资料的过程。
1、普查
概念:根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料。 组织方式:专门组织普查机构调查;
利用现有统计资料;
a) 标准时点(避免重复和遗漏)
b) 调查步骤(同一次调查在不同阶段)
统一性原则 c) 指标口径(内涵)
d) 调查时间(起止)
e) 普查周期:我国为期十年的普查制度
2、抽样调查
抽样调查可分为概率抽样和非概率抽样两类。
(1)概率抽样
a )概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来。
b )特点:
在样本的抽取上遵循随机原则
在调查的功能上能以部分推断总体
在推断的手段上运用概率估计的方法
在推断的理论上,以大数定律和中心极限定理为依据
在推断的效果上,抽样误差可以计算并加以控制
c )概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。重复抽样的特点是:总体的每个个体都有数次被抽中的可能性,次抽样之间相互独立。不重复抽样的特点是:总体中每个个体都只有一次被抽中的可能性, 次抽样之间不相互独立d )概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。
简单随机抽样是抽样调查最基本的组织形式,具体的样本抽取方式有抽签法和随机数表法等;分层抽样特点是必须具备总体所有个体的名录和至少一个分层标志的全面资料,各层的抽样相互独立,尽量把总体差异通过分层而转化为层间差异;等距抽样的特点依固定的间隔和规定的顺序来抽取个体,属于不重复抽样;整群抽样要尽量把总体差异转化为群内差异等,一般属于不重复抽样;多阶段抽样特点是整群抽样和分层抽样两种组织形式的综合。
(2)非概率抽样
是非随机抽样调查,是凭人们的主观判断或根据便利性原则来抽取样本。有任意抽样、典型抽样、定额抽样和流动总体抽样等几种。
3、重点调查
是对数据收集对象总体中的部分重点个体进行观测的统计调查方式。
以客观原则来确定观测单位;
属于范围较小的全面调查。
关键是选择重点单位 确定最低标志值
确定最低重点单位累计标志值比重
4、统计推算
统计推算的概念和特点;统计推算方法。
(二)实验方式
含义和原则;常用的实验设计。
(三)数据收集误差
存在两种误差:观测性误差和代表性误差。
观测性误差也叫登记性误差或调查性误差,在全面调查和非全面调查中
都会产生,是一种非一致性误差;代表性误差是指在抽样调查中,因样本不能完全代表总体而产生,又分为系统性代表性误差和偶然性代表性误差两种。
四、统计数据收集方法
统计数据收集方法,是指获取被调查对象数据的渠道或途径,常用的方
法有直接观察法、通讯法、采访法、登记法等几种。
五、问卷设计
问卷一般由引言、被调查者基本情况、问题和答案、结语四个部分组成。设计时应考虑三个方面问题:问题的编排顺序;提问方式和措辞要点;问卷调查说明等。
第二节 统计数据的整理
一、统计整理的含义与要求
统计整理的含义:
1)依据:研究目的;
2)内容:原始资料、次级资料;
3)目的:反映个体的资料转化为反映总体的资料。 )意义:调查的继续,分析的基础。
要求:
科学性、条理性和充分性。
二、统计整理的内容和步骤
分组、汇总、编表(图),其中汇总是中心内容。
三、统计分组
(一)含义与性质
统计分组是根据事物内在的特点和统计研究的任务,按一定的标志,将统计总体划分为若干个不同的类型或部分(组)的一种统计方法。分组之后应保持组内资料的同质性和组间资料的差异性。
统计分组的关键——选择分组标志。
(二)统计分组的种类
按分组标志性质分:品质标志分组和数量标志分组
b.) 按分组标志多少:简单分组和复合分组。
四、分布数列
(一)分布数列的概念和种类
1.分布数列的概念
2.分布数列的种类
a) 品质数列 ;
b) 变量数列: 单项数列
组距数列 等距数列
异距数列
3 a.) 组别; b.) 分配在各组的单位数。
(二)分布数列的编制
1、单项数列
a) 概念——单一变量值为一组;
b) 适用范围:变动范围不大的离散变量和取整数的连续变量。
c) 编制步骤:确定组数 ; 把总体单位分配在相应各组。
2、 组距数列
a.) 概念——以区间表示一个组;
b.) 适用范围:连续变量、变动范围大的离散变量;
c.) 步骤:确定组距、组数;确定等距或异距; 确定组限; 算组中值。.
3、 组距数列编制中应该注意的问题
a.) 组距和组数:组距的概念;组数的概念;关系
b.) 组限的确定:组限的概念、确定的方法、确定的原则;
c.) 等距数列或异距数列的选择
消除不可比因素的方法:次数密度
d.) 组中值计算:作用、计算条件、计算方法、注意问题:开口组
(三)频率分布
1.频率分布的性质(自学)。
2.频率分布图(自学)。
3.累计频率的计算:
a.) 累计频率的概念:累计频数和累计频率;累计频率计算的方法; b.) 向上累计和向下累计
向上:上限以下
向下:下限以上
累计频数、频率的计算,最后组的特点
第四节 统计图表
一、 统计表
(一)概念
(二)结构
1、从内容看:主词、宾词
2、从形式看:总标题、横行标题、纵栏标题、指标
(三)种类
二、统计图
直方图、折线图、曲线图、累计曲线图(介绍洛仑兹曲线和基尼系数)、茎叶图和箱形图的含义和编制方法。