应用统计学习题
习题一 1.“统计”一词有哪几种含义?它们之间是什么关系? 统计有三种理解:统计工作;统计资料;统计学
这三者之间存在着密切的联系,统计资料是统计工作的成果,统计学来源于统计工作。 2.统计学的基本要素是什么?试举例说明。
统计的要素包括:总体、样本、推断以及推断的可靠性。
总体:就是要调查或统计的某一现象的全部数据集合。例如:要调查的全校学生的身高和体
重。 样本:从总体中抽取的本分个体,并用他们的统计结果代表总体。例如:大二学生的身高和
体重。
推断:以样本包含的信息为基础,对总体的某些特征作出决策、预测、估计。例如:以大二学生的身高体重信息为基础,大致推断全校学生的身高体重。
推断的可靠性:推断的可靠性是统计问题的最重要的要素,他是对推断可靠性的评估,判断
其可信度。如以上的推断有一定的可信度,就可以拿大二学生的身高体重统计结果去衡量全校学生的情况。
3.在应用环境中,统计学可分为哪两类?试举例说明。 描述统计和推断统计
描述统计学:是用图形、表格和概括性的数字对数据进行描述的统计方法;例如将
全
校学生的身高体重按一定的区间段绘制相应的图表。
推断统计学:根据样本信息对总体进行评估、假设实验、预测或其他推断的统计方法,以数据的形态建立出一个用以解释其随机性和不确定性的数学模型。例如对全校的学生的身高体重做回归分析,以预测全国大学生的身高体重。
习题二
1. 统计调查主要有哪些方式?它们的特点和适用条件是什么?
抽样调查和普查
抽样调查是统计调查中应用的最广泛、最重要的一种调查方法,它是通过随机样本对总
体数量规律性进行推断的调查方法。抽样调查不可避免的存在由样本推断总体产生的误差,但统计方法不仅可以推断出误差的多少,而且还可以进一步控制这些误差。抽样调查是科学研究以及管理决策最重要的方法之一。 普查是为达到某一个特定的目的,专门组织的全面的调查。普查涉及总体的每一个个体,所花费的时间、财力、物力、人力都很巨大,因而只能隔较长的时间进行一次,而两次普查之间的年份以抽样方法获得连续的统计数据。 2.某县30个企业固定资产资料如下:
285 340 386 417 485 515 562 620 622 648 655 690 721 743 795 815 840 878 925 930 955 1140 1200 1225 1240 1324 1331 1421 1540 1624
请按等组距的要求选定分组标准进行分组;编制相应的频数(率)分布表和累计频数(率)分布表;并采用相应的图形表示,说明分布特征。若只知道分组资料,如何计算分组资料中
的众数和中位数。 解:
对数据分组如下:
该县的固定资产分布在285-1642之间,按组距为300进行分组,可以看出数据集中分布在600-900一组中,频数为11 。
如果已知分组资料,数据的中位数和众数的求法如下:
N -S m -1f m
30
*i =600+中位数:M
e
≈L +2
-7
*300=818
11
众数:M
≈L +
∆1∆1+∆2
*i =600+
11-6(11-6) +(11-4)
*300=725
3. 根据某城市居民家庭月收入的抽样调查资料计算得到众数为1040元,中位数为1128.57元,问算术平均数约为多少?居民家庭收入的分布情况如何?
_
解:x =1172.86(元) Me =1128.57(元)
说明该城市住户家庭月收入分布呈右(正) 偏态分布。也说明收入分配中算术平均数偏向高端,多数居民收入低于算术平均数。
众数,中位数,算数平均值这三个指标,当图像右偏分布的时候,众数小,中位数居中,算数平均最大;当左偏时,算数平均最小,中位数居中,众数最大。(中位数总是居中!)
习题三
1. 什么是古典概率、统计概率、主观概率?其各自的特点是什么?
答:古典概率:这类游戏有两个共同特点:一是试验的样本空间(某一试验全部可能结果的各元素组成的集合)有限,如掷硬币有正反两种结果,掷骰子有6种结果等;
二是试验中每个结果出现的可能性相同,如硬币和骰子是均匀的前提下,掷硬币出现正反的可能性各为1/2,掷骰子出出各种点数的可能性各为1/6,具有这两个特点的随机试验称为古典概型或等可能概型。特点:可知性,可由演绎或外推法得知随机事件所有可能发生的结果及其发生的次数;无需实验,即不必做统计试验即可计算各种可能发生结果概率;准确性,即按古典概率方法计算的概率是没有误差的。
统计概率:在某个相同的环境下重复进行重复实验,当实验次数越来越多的时候,某个事件发生的频率稳定在某一个固定的常数的附近,频率的波动随着实验次数的增加而逐渐减少,则把这个常数定义为该事件出现的概率。特点:要求做重复实验,存在实验误差。
主观概率:主观概率以概率估计人的个人信念为基础。主观概率可以定义为根据确凿有效的证据对个别事件设计的概率。这里所说的证据,可以是事件过去的相对频率的形式,也可以是根据丰富的经验进行的推测。特点:判断具有明显的主观性 2. 事件互不相容与互相独立两个概念有何关系?
答:互不相容:是指两个事件不会同时发生。
互相独立:对于两个相互独立的事件,其中一个事件发生与否对另外一个事件没有影响。
关系:对于两个互不相容的事件,当知道其中一个的状态的时候就能确定另外一个事件是否发生,也就互不相容事件不会是相互独立的。两个相互独立的事件也不会互不相容。
3. 某动物从出生到存活20岁的概率为0.8,活到25岁的概率为0.4,问现年20岁的动
物活到25岁的概率。 解:
条件概率:P (A |B )
P (AB ) P (B )
已知事件B 发生的条件下A 发生的概率。
由题意设P (B )表示从出生到20岁的概率,从20岁活到25岁的概率为P (A ),则从出生活到25岁为A 和B 事件同时发生P (AB ) 所以P (A|B)=0.4/0.8=0.5
现年20岁的动物活到25岁的概率为0.5
4. 三人独立破译密码,能译出的概率分别为1/5,1/3,1/4,问三人合作能将密码译出的
概率。
解:
应用对立事件做这个题目
这三个人破译不出密码的概率为4/5,2/3,3/4。那么三个都破译不出密码的概率为 4/5*2/3*3/4=0.4 那么三人合作能够破译出密码的概率为1-0.4=0.6
5. 某射击小组共20名射手,其中一级射手4人,二级射手8人,三级射手7人,四级射
手1人,他们能通过选拔赛的概率分别为0.9,0.7,0.5,0.2,求任选一射手,其能通
过选拔赛的概率。
解:
全概率公式
用An 表示抽取是第n 级的射手,选择该射手能够通过选拔的事件为B
根据题意有P (A1)=4/20=0.2 P(A2)=8/20=0.4 P (A3)=7/20 P(A4)=1/20 P(B)=P(B|A1)*P(A1)+P(B|A2)P(A2)+P(B|A3)P(A3)+P(B|A4)P(A4)=0.645
6. 甲、乙、丙三个机床生产同类型的螺丝钉,其产量分别为25%,35%,40%,已知各机
床产品的废品率各为5%,4%,2%。现检测出这批螺丝钉中一只为废品,问该废品是
甲、乙、丙三个机床生产的可能性分别是多少。 解: 贝叶斯公式
射随机抽取一直螺丝钉,该螺丝钉分别由甲、乙、丙机床生产的事件为A1、A2、A3 抽出的螺丝钉为废品的事件为B 事件
3
P (B )=∑P (B |Ai ) P (Ai ) =0.0345
i =1
P(Ai|B)=P(AiB)/P(B)=P(B|Ai)P(Ai)/P(B) 得到: P (A1|B)=0.36 P (A2|B)=0.41
P (A3|B)=0.23
所以该废品是甲乙丙三个机床生产的可能性分别为:0.36、0.41、0.23
7.出口服装的谈判中,每次谈判,男装成交的概率为0.35,女装成交的概率为0.50,两者相互独立。问在一次谈判中出现下列情况的概率。 1)男女装均成交
2)男女装至少一个成交 3)男装成交而女装不成交 4)男女装均未成交
解:设男装成交的事件为A ,女装成交的事件为B
1) 交事件:P (A )P (B )=0.35*0.50=0.175
2) 并事件:P (A )+P(B )-P (A )P (B )=0.35+0.5-0.175=0.675 3) 交事件:P (A )(1-P (B ))=0.175 4) 交事件:(1-P(A))(1-P(B))=0.325
8. 甲乙两国比赛乒乓球,每一局甲胜的概率为0.6,乙胜的概率为0.4,现在甲国拥有比赛
的组织权,可以选择赛制(3局2胜或5局3胜),问甲国可能倾向于采用哪种赛制? 解:
1) 假设选择3局2胜制:
设Ai 表示i 局甲国胜出
若前两局甲胜出:0.6*0.6=0.36
前两局输了一局:2*0.6*0.4*0.6=0.288 那么甲国胜出的概率为:0.648
2) 假设选择5局3胜制:
可以分比赛一共进行了3局,4局,5局三种情况分类 打三局:0.6*0.6*0.6=0.216
打四局:3*0.6*0.6*0.4*0.6=0.2592
打五局:6*0.6*0.6*0.4*0.4*0.6=0.20736
那么甲国胜出的概率为:0.68256
因为0.68256>0.648所以甲国应该选择5局3胜制
习题四
1.某商店运来6台彩电,其中2台外壳有缺陷。一学校随机买了3台,用X 表示学校购买的电视机中外壳有缺陷的电视机数,问:1) X 的分布列;2)E(X)和D(X) 解:
D (X )=EX
2
(EX )
2
2
X 的分布列为
E (X 2)=1.4 所以D (X )=1.4-1=0.4
2.一张考卷中有15道选择题,每题有4个备选答案,其中只有一个是正确的。若有一考生随机作答,问:1)答对5至10题的概率;2)答对的期望数
解:设答对的题目数量为X ,则X~B(15,0.25)
1) 答对5至10题
P (X=5)=P (X=6)=0.092 P (X=7)=0.039 P (X=8)=0.013 P (X=9)=0.003 P (X=10)=0.001
得到P (4
2)E(X)=np=15*0.25=3.75
C 150. 25*0. 75
5
5
10
=0.165
3.某城市一路口每月平均发生5起交通事故,若每月发生的事故数服从泊松分布,则在12月份出现以下事故数的概率。1)超过8次;2)介于(包括)3次和11次之间
解:
设发生事故的次数为X ,则由题意得到
P (X=x)=
λe
x -λ
x !
其中λ=5
1) P (X>8)=1-P(X
P(X
所以P (X>8)=1-0.932=0.068
2) P(3
4.某批塑料制品的断裂强度服从正态分布,标准差为3.5公斤,在所生产的样品中,大约有1.83%未通过质量试验。已知试验中施加的压力是130公斤,问这批塑料制品的平均断裂强度。
解:设在实验中施加的力为X ,由题意可得X~N(μ, 3.52) P (X
130-μ
) =0.183 即Φ(
3.5
显然
130-μ3.5
) =1-Φ(
所以Φ(
130-μμ-130
3.5
3.5
μ-130Φ() =0.9817
3.5
) =0.183
查正态分布表得到μ=137.32 所以平均断裂强度为137.32公斤
5.某股民在股票交易中每次判断正确的概率是60%,该股民在最近作了100次交易,问至少50次成功的概率。
解:设成功交易的次数为X ,则X~B(100,0.6)
因为np=60 n (1-p )=40 都远大于5 所以这个二项分布可以用正态分布近似表示 X~N(60,24)
至少50次成功可以表示为P (X>=50)=P(X=100)-P(X=49.5)=Φ(
Φ(
49.5-60
24
) =0.62254
100+0.5-60
24
) -
习题七 1.
指标按照其数值表现形式, 可分为哪几类, 各有何作用. 答:
总体指标:统计资料经汇总整理后得到的反映总体规模和水平的总和指标,其表现
形式是具有计量单位的绝对数,如:企业销售收入。
相对指标:通过两个有联系的指标进行对比的比值来反映现象的数量特征和数量关系的综合指标,如:计划完成进度。
平均指标:同类现象在一定时间、地点条件下就达到的一般水平,是对变量分布集中趋势的测定,如:各类平均数。
2. 从指标变量的性质和数列形态来分, 时间数列有哪几种, 如何区分. 答:
随机型时间序列 确定型事件序列
3. 现有某企业1-7月份的如下资料
求: (1)上半年月平均销售产值和平均职工人数
(2)上半年月平均全员劳动生产率, 上半年的全员劳动生产率, 和上半年职工构成指标 (3)对比分析该企业一、二季度的销售产值的发展和增长情况.
解:(1)上半月平均销售产值=(84+102+90+92+91+94)/6=91.8 平均职工人数=((100+110)/2+98+100+103+105+105)/6=103
(2)上半年平均全员劳动生产率=上半年销售总产值/平均职工人数=5.386363636 上半年月平均全员劳动生产率=月平均销售产值/平均职工人数=0.894155844 上半年月平均工人数=71
上半年平均工人数占平均职工数的比率=71/103=0.68932 (3)计算第一第二季度的平均发展,再比较
习题八
1. 什么是指数,它有哪几种分类,各自的定义和作用是什么? 答:
指数:指数是一种反应经济变量在时间或空间上(综合)变动状况的相对数。 分类:
1) 按指数所反映的范围不同
个体指数:是指反应单个现象变动的相对数。 总指数:反应多个现象综合变动的相对数。 2) 按计算过程中用的不同指标
数量指标:反应的是现象总得规模水平的变动。 质量指标:反应的是现象相对水平或平均水平的变动。 3) 按计算方式分类
简单指数:
加权指数:
2. 同度量因素起什么作用,如何使用?
答:同度量指标作用:将不具有可加性的的指标变成具有可加性的指标。 在指数编制中,把在经济意义上不能加总的社会经济现象的量,使之过渡为能够直接加总的现象所采用的那个媒介因素。同度量因素一般是作为被乘数出现而使各种不能直接相加的现象过渡到可以相加,从而综合反映其总的变动程度。
3. 某厂各种可比产品总成本1999年为30万元,比1998年增加5万元,单位产品成本1999年比1998年平均降低3%。 求:(1)产品总成本指数 (2)产品产量指数
(3)由于单位成本降低而节约的绝对额 解: 1998年产品总成本=30-5=25
(1) 总成本指数=30/25=120%
(2) 设1998年生产量为X ,1999年生产量为Y
根据题目条件得到:(1-3%)*25/X=30/Y 整理得到:Y/X=1.24
(3) 节约额为5万元