人教版高一数学必修三第二章统计全部教案和测试题
人教版高一数学必修三
第二章 统计
目录
2.1.1 简单随机抽样(新授课) 2.1.2 系统抽样(新授课) 2.1.3 分层抽样(新授课)
2.2.1用样本的频率分布估计总体分布(2课时) (新授课)
2.2.2用样本的数字特征估计总体的数字特征(2课时) (新授课) 2.3.1 变量之间的相关关系(新授课)
2.3.2 两个变量的线性相关(第一课时)(新授课) 2.3.2 两个变量的线性相关(第二课时)(新授课) 2.3.2 生活中线性相关实例(第三课时)(新授课) 第二章 统计单元检测题(一) 第二章 统计单元检测题(一)参考答案 第二章 统计单元检测题(二) 第二章 统计单元检测题(二)参考答案 第二章 统计单元检测题(三) 第二章 统计单元检测题(三)参考答案
第二章 统计
一、课程目标:
本章主要介绍最基本的获取样本数据的方法,以及集中从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。本章通过实际问题,进一步介绍随机抽样、样本估计总体、线性回归的基本方法。 二、学习目标: 1、随机抽样
(1)能从现实生活或其他学科中提出具有一定价值的统计问题。 (2)结合具体的实际问题情境,理解随机抽样的必要性和重要性。
(3)在参与解决统计问题的过程中,学会用简单随机抽样从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。
(4)通过试验、查阅资料、设计调查问卷等方法收集数据。 2、用样本估计总体
(1)通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布彪、花频率分布直方图、频率折线图、茎叶土,体会它们各自的特点。
(2)通过实例理解样本数据标准差的意义和作用,学会计算数据样本差。
(3)能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释。
(4)进一步体会用样本估计总体的思想。
(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。 (6)形成对数据处理过程进行初步评价的意识。 3、变量的相关性
(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
(2)经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想。能根据给出的线性回归方程的系数公式建立线性回归方程。
四、课时分配:
全章共安排了3个小节,教学约需16课时,具体安排如下: 2.1 随机抽样 约5课时 2.2 用样本估计总体 约5课时 2.3 变量间的相关关系 约4课时 实习作业 约1课时 小结 约1课时
2.1.1 简单随机抽样(新授课)
一、教学目标:
知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤; 过程与方法:
(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;
(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。 情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。 二、教学重点与难点
正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。 三、教学过程
(一)创设情景,揭示课题
假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?
显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢? (二)探究新知
1、简单随机抽样的概念
一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ), 如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
注意:简单随机抽样必须具备下列特点:
(1)简单随机抽样要求被抽取的样本的总体个数N 是有限的。 (2)简单随机样本数n 小于等于样本总体的个数N 。 (3)简单随机样本是从总体中逐个抽取的。 (4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。 思考:下列抽样的方式是否属于简单随机抽样?为什么? (1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
2、抽签法和随机数法 (1)、抽签法的定义。
一般地,抽签法就是把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本。
抽签法的一般步骤: a 、将总体的个体编号。
b 、连续抽签获取样本号码。
思考:你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?
(2)随机数表法:
利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001,„,799。
第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。(课本59页)
第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,„,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
注:随机数表法的步骤: a 、将总体的个体编号。
b 、在随机数表中选择开始数字。 c 、读数获取样本号码。 (三)典例精析
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
分析: 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
分析: 简单随机抽样一般采用两种方法:抽签法和随机数表法。
解法1:(抽签法)将100件轴编号为1,2,„,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。
解法2:(随机数表法)将100件轴编号为00,01,„99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。 (四)课堂练习:P59 练习 (五)课时小结
1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽
签法和随机数法。
2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开业,避免在解题中出现错误。 (六)课堂检测:
1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是
A .总体是240 B 、个体是每一个学生 C 、样本是40名学生 D 、样本容量是40
2、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )
A 、总体 B 、个体是每一个学生 C 、总体的一个样本 D 、样本容量
3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 。
4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 。 四、课后反思:
2.1.2 系统抽样(新授课)
一、教学目标:
知识与技能:
(1)正确理解系统抽样的概念; (2)掌握系统抽样的一般步骤;
(3)正确理解系统抽样与简单随机抽样的关系;
过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,
情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系。
二、教学重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题。
三、教学过程:
(一)创设情境,引入课题:
某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法? (二)研探新知
1、系统抽样的定义:
一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
注意:系统抽样的特证:
(1)当总体容量N 较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,
系统抽样又称等距抽样,这时间隔一般为k =[
N ].
(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在
此编号的基础上加上分段间隔的整倍数即为抽样编号。
思考:
(1)你能举几个系统抽样的例子吗?
(2)下列抽样中不是系统抽样的是 ( )
A 、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到 大号排序,随机确定起点i, 以后为i+5, i+10(超过15则从1再数起) 号入样
B 工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C 、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定
的调查人数为止
D 、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
答案:(2)C 不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事
先规定的概率入样。 2、系统抽样的一般步骤。
(1)采用随机抽样的方法将总体中的N 个个编号。 (2)将整体按编号进行分段,确定分段间隔k(k∈N,L ≤k).
(3)在第一段用简单随机抽样确定起始个体的编号L (L ∈N,L ≤k )。
(4)按照一定的规则抽取样本,通常是将起始编号L 加上间隔k 得到第2个个体编号L+K,再加上K 得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 注意:从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解
决,从而把复杂问题简单化,体现了数学转化思想。 (三)典例精析:
例1、某校高中三年级的295名学生已经编号为1,2,„„,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
分析:按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号。
解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k ≤5) ,那么抽取的学生编号为k+5L(L=0,1,2,„„,58) ,得到59个个体作为样本,如当k=3时的样本编号为3,8,13,„„,288,293。
例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是
A .5,10,15,20,25 B、3,13,23,33,43 C .1,2,3,4,5 D、2,4,6,16,32
简析:用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求,故选B 。 (四)课堂练习P61 练习1. 2. 3 (五)课时小结
1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:
(1)采用随机的方法将总体中个体编号;
(2)将整体编号进行分段,确定分段间隔k(k∈N) ;
(3)在第一段内采用简单随机抽样的方法确定起始个体编号L ; (4)按照事先预定的规则抽取样本。
2、在确定分段间隔k 时应注意:分段间隔k 为整数,当不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k 。 (六)课堂检测:
1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( )
A .99 B、99,5 C .100 D、100,5
2、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( ) A .1,2,3,4,5 B、5,16,27,38,49 C .2, 4, 6, 8, 10 D、4,13,22,31,40
3、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 ( ) A .8 B.8,3 C .8.5 D.9
4、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会
后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。
5、某单位的在岗工作为624人,为了调查工作上班时,从家到单位的路上平均所用的时间,决定抽取10%的工作调查这一情况,如何采用系统抽样的方法完成这一抽样?
四、课后反思:
2.1.3 分层抽样(新授课)
一、教学目标:
知识与技能:
(1)正确理解分层抽样的概念; (2)掌握分层抽样的一般步骤;
(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。 过程与方法:通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问
题的方法。
情感态度与价值观:通过对统计学知识的研究,感知数学知识中“估计”与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观。
二、教学重点与难点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题。 三、教学过程:
(一)创设情景,引入新课
假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本? (二)研探新知
1、分层抽样的定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。
注意:分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,
即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层
样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。 2、分层抽样的步骤:
(1)分层:按某种特征将总体分成若干部分。 (2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。 (4)综合每层抽样,组成样本。 注意:
(1)分层需遵循不重复、不遗漏的原则。 (2)抽取比例由每层个体占总体的比例确定。 (3)各层抽样按简单随机抽样进行。
3、 简单随机抽样、系统抽样、分层抽样的比较
(三)典例精析
例1、分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体成
样本,所以分层抽样为保证每个个体等可能入样,必须进行( )
A 、每层等可能抽样 B 、每层不等可能抽样
C 、所有层按同一抽样比等可能抽样
简析:保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽样共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的,故此选C 。
例2、如果采用分层抽样,从个体数为N 的总体中抽取一个容量为n 的样本,那么每个个体被抽到的可能性为 ( )
n n 1
A .N B. n C. N D. N
简析:根据每个个体都等可能入样,所以其可能性本容量与总体容量比,故此题选C 。 例3、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为 A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20
简析:因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各抽取的个体数分别为3x,2x,4x, 由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D 。
例4、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。
简析:采用分层抽样的方法。
因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。 300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。 (3)将300人组到一起,即得到一个样本。 (四)课堂练习P64 练习1. 2. 3 (五)课时小结
1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的
差异要小,面层之间的样本差异要大,且互不重叠。
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。
2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。 (六)课堂检测
1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )
A .简单随机抽样 B .系统抽样 C .分层抽样
D .先从老人中剔除1人,然后再分层抽样
2、某校有500名学生,其中O 型血的有200人,A 型血的人有125人,B 型血的有125人,AB 型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O 型血应抽取的人数为 人,A 型血应抽取的人数为 人,B 型血应抽取的人数为 人,AB 型血应抽取的人数为 人。
3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2, 若该校取一个容量为n 的样本,则n= 。
4、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:
试利用上述资料设计一个抽样比为1/10的抽样方法。
四、课后反思
2.2.1用样本的频率分布估计总体分布(2课时) (新授课)
一、教学目标: 知识与能力:
(1) 通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。 二、教学重点与难点
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。 难点:能通过样本的频率分布估计总体的分布。 三、教学过程:
(一)创设情境,引入课题
在NBA 的2004赛季中, 甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕ 甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。 (二)研探新知
阅读课本67页探究(让学生展开讨论)
为了制定一个较为合理的标准a ,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。 下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。
1、频率分布的概念:
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:
(1) 计算一组数据中最大值与最小值的差,即求极差 (2) 决定组距与组数 (3) 将数据分组 (4) 列频率分布表 (5) 画频率分布直方图
以课本P 67制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。(让学
生自己动手作图)
频率分布直方图的特征: (1)、从频率分布直方图可以清楚的看出数据分布的总体趋势。 (2)、从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?
思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见课本P 68)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)
2、频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。 总体密度曲线:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。 思考: (1).对于任何一个总体,它的密度曲线是不是一定存在?为什么? (2).对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确. 3、茎叶图 (1).茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P 61例子) (2).茎叶图的特征:
a 、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
b 、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 (三) 典例精析
例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比. 。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。 解:(1)样本频率分布表如下:
(2)其频率分布直方图如下:
cm )
(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%. 例2:为了了解高一学生的体能情
况, 某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,
画出频率分布直方图(如图) ,图中从
左到右各小长方形面积之比为2:4:
17:15:9:3,第二小组频数为12. (1) 第二小组的频率是多少?样本
容量是多少? (2) 若次数在110以上(含110次)为达标,试估计该学校全体高一
学生的达标率是多少?
(3) 在这次测试中,学生跳绳次数的
中位数落在哪个小组内?请说
明理由。
分析:在频率分布直方图中,各小长
方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:
4
=0.08
2+4+17+15+9+3
又因为频率=
第二小组频数
样本容量
第二小组频数12
==150
第二小组频率0.08
所以 样本容量=
(2)由图可估计该学校高一学生的达标率约为
17+15+9+3
⨯100%=88%
2+4+17+15+9+3
(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,
前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。 (四)课堂练习:P73 练习 1. 2. 3 (五)课堂小结
1、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。
2、总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
(六)布置作业:P84 习题2.2 A 组 1、 2 四、课后反思
2.2.2用样本的数字特征估计总体的数字特征(2课时) (新授课)
一、教学目标: 知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。 (4)形成对数据处理过程进行初步评价的意识。 过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。 情感态度与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。 二、教学重点与难点
重点:用样本平均数和标准差估计总体的平均数与标准差。 难点:能应用相关知识解决简单的实际问题。 三、教学过程
(一)创设情境,引入新课
在一次射击比赛中, 甲、乙两名运动员各射击10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。 (二)研探新知
1、众数、中位数、平均数 探究:P74
(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)
初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
提出问题:原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。
提问:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边
和右边的直方图的面积应该相等。由此可以估计出中位数的值为2.02。 思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?
(课本75页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
2、标准差、方差 (1)标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中, 甲、乙两名运动员各射击10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,x 甲=7, x 乙
=7。
两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P78图2. 2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s 表示。
样本数据x 1, x 2,
, x n 的标准差的算法:
(1) 、算出样本数据的平均数x 。
(2) 、算出每个样本数据与样本数据平均数的差:x i -x (i =1,2, (3) 、算出(2)中x i
n )
-x (i =1,2, n ) 的平方。
(4) 、算出(3)中n 个平方数的平均数,即为样本方差。 (5) 、算出(4)中平均数的算术平方根,,即为样本标准差。 其计算公式为:
s =
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。 提出问题:标准差的取值范围是什么?标准差为0的样本数据有什么特点? 从标准差的定义和计算公式都可以得出:s
≥0。当s =0时,
意味着所有的样本数据都
等于样本平均数。 (2).方差
从数学的角度考虑,人们有时用标准差的平方s (即方差)来代替标准差,作为测量样本数据分散程度的工具:
12
[(x 1-x ) 2+(x 2-x ) 2++(x n -x ) 2] s =n
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。 (三)典例精析
例1:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5 (2)4,4,4,5,5,5,6,6,6 (3)3,3,4,4,5,6,6,7,7 (4) 2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:四组数据的平均数都是5. 0,标准差分别为:0. 00,0. 82,1. 49,2. 83。 他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。 例2:(见课本P80)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的
平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
(四)课堂练习:P82练习 1. 2. 3 4 (五)课堂小结
1、用样本的数字特征估计总体的数字特征分两类: (1)用样本平均数估计总体平均数。
(2)用样本标准差估计总体标准差。样本容量越大,估计就越精确。 2、平均数对数据有“取齐”的作用,代表一组数据的平均水平。
3、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。 (六)、布置作业: P84 习题2.2 A 组 3、 4、10 四、课后反思
2
2.3.1 变量之间的相关关系(新授课)
一、教学目标:通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。 二、教学重点与难点:
重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。 难点:变量之间相关关系的理解。 三、教学过程: (一)引入:
1. 粮食产量与施肥量有关系吗?
2. 提问:" 名师出高徒" 可以解释为教师的水平越高,学生的水平也越高。教师的水平与学生的水平有什么关系?
你能举出更多的描述生活中两个变量的相关关系的成语吗?(水滴石穿 三人行必有我师等) (二)、讲授新课:
1. 问题的提出:课本87页思考:
学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系。(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对。)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法。数学成绩的高低对物理成绩的高低是有一定影响的。但决非唯一因素,还有其它因素,如是否喜欢物理,用在物理学习上的时间等等。(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少。但这两个变量是有一定关系的,它们之间是一种不确定性的关系。如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义。)
2.相关关系的概念
相关关系:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。相关关系是一种非确定性关系。 (分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)
举例:课本87页例子
(三)课时小结:1. 现实生活中相关关系的实例。2. 相关关系的概念。 (四)巩固练习 1、课本P88 1,2。
2、分析:人的身高和年龄是一对相关关系。因为在某一个年龄上,人的身高在取值上带有一定的随机性,如受遗传. 营养. 体育锻炼. 心理素质等因素的影响。 3、讨论:期中考试数学成绩与复习时间的投入量的关系。(还可能受身体状况. 心情问题等影响)。
(五)布置作业
1. 调查人的身高与他的右手长的关系。
2. 收集你从小学到高中的数学成绩并分析比较,得出结论。 四、课后反思:
一、教学目标:
明确事物间的相互联系。认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。 二、教学重点与难点
重点:利用散点图直观认识两个变量之间的线性关系. 难点:作散点图和理解两个变量的正相关和负相关。 三、教学过程: (一)引入
1. 人的身高和体重之间的关系?
2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么. (二)讲授新课: 1、 散点图
(1)例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 年龄 23 27 38 41 45 49 50 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加。我们可以作散点图来进一步分析。
(2)散点图的概念:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。(1. 如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.2. 如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。3. 如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)
(3)正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)
(4)讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?(比如高学历高收入现象)
(三)课堂练习:
一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:
零件数 10 20 30 40 50 60 70 80 90 100 加工时间 62 68 75 81 89 95 102 108 115 122 1. 画出散点图。
2. 指出是正相关还是负相关。
3. 关于加工零件的个数与加工时间,你能得出什么结论?
(四)课时小结:1. 散点图的画法。 2. 正相关与负相关的概念。 (五)布置作业:课本P98 A 组 2 B 组 1题 (1) 四、课后反思
一、教学目标:
经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程. 二、教学重点与难点
重点:根据给出的线性回归方程的系数公式建立线性回归方程. 难点:理解最小二乘法的思想 三、教学过程: (一)复习引入:
1. 作散点图的步骤和方法?正. 负相关的概念?
2. 提问:看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢? (二)讲授新课: 1、回归直线:
(1)从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。(线形相关→回归直线)
(2)提问:从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。那么,怎样确定这条直线呢? 讨论:①选择能反映直线变化的两个点。
②在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
③多取几组点对,确定几条直线方程。再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。)。教师:分别分析各方法的可靠性。 2. 教学最小二乘法:
(1)求回归方程的关键是如何用数学的方法刻画" 从整体上看,各点与此直线的距离最小" .(课本92页分析)
(2)最小二乘法公式:求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法。公式见课本P92
(3)举例:有一间商店,为了研究气温对冰箕淋销售的影响。经过统计,得到一个卖出的冰箕淋与当天气温的对比表。 气温 -5 0 4 12 19 21 23 27 31 36
冰箕淋个数 2 10 26 75 104 143 128 132 145 156
①画出散点图。②. 求回归方程。③. 如果气温是25,预测这天卖出的冰箕淋个数。 (学生共练 教师分析 师生共同总结) (三)课堂练习:课本P98 A 组 3 (四)课时小结:如何求回归直线
(五)布置作业:课本P98 A 组 第4题 四、课后反思
2.3.2 生活中线性相关实例(第三课时)(新授课)
一、教学目标:通过生活实例进一步了解最小二乘法思想.
二、教学重点与难点:
重点:生活实例的直线回归分析. 难点:最小二法思想的理解. 三、教学过程: (一)、复习引入:
1. 如何求回归直线方程?
2. 最小二乘法思想的是什么?在我们生活中如何应用,能举一. 两个例子? (二)、讲授新课:
1. 直线回归方程的应用
(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量系
(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量)
进行估计,即可得到个体Y 值的容许区间。 (3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的标。 2.实例分析:
某调查者从调查中获知某公司近年来科研费用支出( )与公司所获得利润( )的统计资料如下表:科研费用支出( )与利润( )统计表。单位:万元 年份 科研费用支出 利润 1998 5 31 1999 11 40 2000 4 30 2001 5 34 2002 3 25 2003 2 20 合计 30 180
要求估计利润( )对科研费用支出( )的线性回归模型。 现利用公式(Ⅰ)、(Ⅱ)、(Ⅲ)求解参数 的估计值:利润( )对科研费用支出( )的线性回归模型直线方程为: (过程略) (学生练习 教师分析 师生共同总结) (三)课堂练习:课本P98 A 组 2
(四)课时小结:回归直线方程,最小二乘法基本思想. (五)布置作业:课本P98 B 组 1 四、课后反思
第二章 统计单元检测题(一)
一、选择题
1 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12, 设其平均
数为a , 中位数为b , 众数为c ,则有( ) A a >b >c B b >c >a C c >a >b D c >b >a 2 下列说法错误的是 ( )
A 在统计里,把所需考察对象的全体叫作总体
B 一组数据的平均数一定大于这组数据中的每个数据
C 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 D 一组数据的方差越大,说明这组数据的波动越大
3 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,
那么由此求出的平均数与实际平均数的差是( ) A 3. 5 B -3 C 3 D -0. 5
4 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )
A 平均数方差 C 众数频率分布
5 要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )
5,10,15,20,25,30 B 3,13,23,33,43,53
C 1,2,3,4,5,6 D 2,4,8,16,32,48
6
A 14和0.14 B 0. 14和14 C
111和0.14 和 14314
二、填空题
1为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有 ;
① 2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本; ④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等
2 经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的2位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人
3数据70,71,72,73的标准差是______________
4数据a 1, a 2, a 3,..., a n 的方差为σ,平均数为μ,则
2
(1)数据ka 1+b , ka 2+b , ka 3+b ,..., ka n +b ,(kb ≠0) 的标准差为,
(2)数据k (a 1+b ), k (a 2+b ), k (a 3+b ),..., k (a 的标准差为n +b ),(kb ≠0)
5 观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(2700,3000]的
三、解答题
50
2 为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数
(1)求出表中m , n , M , N 所表示的数分别是多少? (2)画出频率分布直方图
(3)全体女生中身高在哪组范围内的人数最多?
3 某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为
185的样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有多少
学生?
4 从两个班中各随机的抽取10名学生,他们的数学成绩如下:
画出茎叶图并分析两个班学生的数学学习情况
第二章 统计单元检测题(一)参考答案
一、选择题
1 D 总和为147, a =14.7;样本数据17分布最广,即频率最大,为众数,c =17;
从小到大排列,中间一位,或中间二位的平均数,即b =15 2 B 平均数不大于最大值,不小于最小值
90
=3, 平均数少3,求出的平均数减去实际的平均数等于-3 3060
=10,间隔应为10 4 D 5 B 6
14
=0.14 6 A 频数为100-(10+13+14+15+13+12+9) =14;频率为100
3 B 少输入90,
二、填空题
1 ④,⑤,⑥ 2000名运动员的年龄情况是总体;每个运动员的年龄是个体; 2 3 3位执“一般”对应1位“不喜欢”,即“一般”是“不喜欢”的3倍,而他们的
差为12人,即“一般”有18人,“不喜欢”的有6人,且“喜欢”是“不喜欢”
的6倍,即30人,全班有54人,30-
1
⨯54=3 2
3
70+71+7+273=71. 5 = ,
4
s =4 (1)k
=
σ,k μ+b (2)k σ,k μ+kb
ka 1+b +ka 2+b +... +ka n +b a +a +... +a n
=k ⋅12+b =k μ+
b
n n
(1)=
s ===k σ(2)=
k (a 1+b ) +k (a 2+b ) +... +k (a n +b ) a +a +... +a n
=k ⋅12+nb =k μ+
nb
n n
s ===k σ
5 0. 3 频率/组距=0.001,组距=300,频率=0.001⨯300=0.3
三、解答题
10⨯8+9⨯6+8⨯5+7⨯16+6⨯4+5⨯7+4⨯3+3⨯1360
==7.2
5050
1
=50, m =50-(1+4+20+15+8) =2 2 解:(1)M =
0.022
=0.04 N =1, n =50
(2)…(3)在153.5157.5范围内最多
1 解:=
3 解:从高三年级抽取的学生人数为185-(75+60) =50
而抽取的比例为
5011
==3700 ,高中部共有的学生为185÷10002020
4 解:
第二章 统计单元检测题(二)
一、选择题
1数据a 1, a 2, a 3,..., a n 的方差为σ,则数据2a 1,2a 2,2a 3,...,2a n 的方差为( )
2
σ2
2
B σ
2
C 2σ
2
4σ
2
2 某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2, „„,270;使用系统抽样时,将学生统一随机编号1,2, „„,270,并将整个编号依次分为10段 如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270; 关于上述样本的下列结论中,正确的是( ) ②、③都不能为系统抽样 B ②、④都不能为分层抽样 C ①、④都可能为系统抽样 D①、③都可能为分层抽样 3一个容量为40的样本数据分组后组数与频数如下:[25,253),6;[253,6),4;[256,259),10;[25 9,262),8;[26 2,265),8;[265, 8),4;则样本在[25,259)上的频率为( )
3 20
B 1 10
C 1 2
1 4
4设有一个直线回归方程为y =2-1.5x ,则变量x 增加一个单位时( )
y 平均增加1.5个单位
B y 平均增加2个单位
C y 平均减少1.5个单位
D y 平均减少2个单位
5 在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后, 所剩数据的平均值和方差分别为 ( )
9. 4, 0. 4 8 B 9. 4, 0. 0 1 C 9. 5, 0. 0 9. 5, 0. 0 1
二、填空题
1 已知样本9,10,11, x
, y 的平均数是10
xy =
2一个容量为20的样本,已知某组的频率为0.25,则该组的频数为__________
3用随机数表法从100名学生(男生25人)中抽取20人进行评教,某男生被抽取的机率
是___________________
4一个容量为20的样本数据,分组后组距与频数如下表:
则样本在区间(-∞,50) 上的频率为__________________
5 某单位有老年人28人,中年人54人,青年人81人,为调查身体健康状况,需要从中抽取一个容量为36的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取 人 三、解答题
1 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?
2 某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人 为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在不到40岁的教师中应抽取的人数为多少人?
3 已知200辆汽车通过某一段公路时的时速的频率
分布直方图如右图所示,求时速在[60,70]的汽车
大约有多少辆?
)
第二章 统计单元检测题(二)参考答案
一、选择题
n
1n 1n 212
1 D σ=∑(X i -) , ∑(2X i -2) =4⋅∑(X i -) 2=4σ2,
n i =1n i =1n i =1
2
2 D ③的间隔为27,可为系统抽样;④的第一个数为30,不符合系统抽样,因为间隔
为27,④的第一个数应该为127;分层抽样则要求初一年级应该抽取4人,号码在1108,所以④中的111不符合分层抽样 3 C [25,25 9]包括[25,25 3],6;[25 3,25 6],4;[25 6,25 9],
10;频数之和为20,频率为
4 C
201= 402
9.4⨯3+9.6+9.41n 12
=9.5,5 D =σX =∑(X i -) 2=(0.12⨯4+0.22) =0.016
5n i =15
二、填空题
1 96 9+10+11+x +y =50, x +y =20,1+1+(x -10) 2+(y -10) 2=10,
x 2+y 2-20(x +y ) =-192,(x +y ) 2-2xy -20(x +y ) =-192, xy =-96
2 5 频率=
1201频数
= 3 每个个体被抽取的机率都是
51005样本容量
4 0. 7
14
=0.7 20
363636
≈6,54⨯≈12,81⨯≈18, 163163163
12,18 总人数为28+54+81=163,28⨯5 6,
三、解答题 1 解:x 甲=
s 甲
2
11
(60+80+70+90+70) =74 x 乙=(80+60+70+80+75) =73 55112=142+62+42+162+42)=104 s 乙=72+132+32+72+22)=56 55
2
2
∵ x 甲>x 乙,s 甲>s 乙
∴ 甲的平均成绩较好,乙的各门功课发展较平衡 2 解:而抽取的比例为
701
=, ,在不到40岁的教师中应抽取的人数为 4907
350⨯
1
=50 7
3 解:在[60,70]的汽车的频率为0.04⨯10=0.4,
在[60,70]的汽车有200⨯0.4=80
第二章 统计单元检测题(三)
一、选择题
1 某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人, 现抽取30人进行分层抽样,则各职称人数分别为( )
A 5, 10, 1 5 B 3, 9, 1 8 C 3, 10, 1 7 D 5, 9, 1 6
2从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,
则分段间隔应为( )
AN ⎡N ⎤⎡N ⎤n C⎢⎥ D⎢⎥+1 n ⎣n ⎦⎣n ⎦
3有50件产品编号从1到50, 现在从中抽取5件检验, 用系统抽样
确定所抽取的编号为( )
A 5,10,15, 20, 25 B5,15,20,35,40
C 5,11,17,23,29 D 10,20,30,40,50
4用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A 总体容量越大,估计越精确 B总体容量越小,估计越精确
C 样本容量越大,估计越精确 D样本容量越小,估计越精确
5 对于两个变量之间的相关系数,下列说法中正确的是( )
A r 越大,相关程度越大
B r ∈(0, +∞),r 越大,相关程度越小,r 越小,相关程度越大
C r ≤1且r 越接近于1,相关程度越大;r 越接近于0,相关程度越小
D 以上说法都不对
二、填空题
1
2 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样 考虑用系统抽样,则分段的间隔k 为_______________
3 从10个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________ 4 采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,个体 a 前两次未被抽到,第三次被抽到的概率为_____________________
5 甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下
则两人射击成绩的稳定程度是__________________三、解答题
1
如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.589.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
2 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 时的销售价格
2
第二章 统计单元检测题(三)参考答案
一、选择题
301111
=,15⨯=3, 45⨯=9,90⨯=18 1505555
2 C 剔除零头 3 D 间隔为10 4 C 5 C
1 B 抽取的比例为
二、填空题
1 函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性
1200
简单随机抽样 总体个数较少 40114 不论先后,被抽取的概率都是
1010
2 30
2222
5 甲比乙稳定 甲=8, 乙=8, 而σX 甲=1.2, σX 乙=1.6, σX 甲
三、解答题 1 解:(1)频率为:0.025⨯10=0.25,频数:60⨯0.25=15
(2)0.015⨯10+0.025⨯10+0.03⨯10+0.005⨯10=0.75 2 解:(1)数据对应的散点图如图所示:
5
152
(2)x =∑x i =109,l xx =∑(x i -x ) =1570,
5i =1i =1
5
y =23. 2, l xy =∑(x i -x )(y i -y ) =308
i =1
设所求回归直线方程为y =bx +a ,
则b =
l xy l xx
=
308308
≈1. 8166 ≈0. 1962 a =y -b x =23. 2-109⨯
15701570
x +1. 8166 故所求回归直线方程为y =0. 1962
(3)据(2),当x =150m 时,销售价格的估计值为:
2
y =0. 1962⨯150+1. 8166=31. 2466(万元)