2012高二精品数学统计案例综合检测
选修2-3第三章 统计案例 综合检测
时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2010·宁夏银川模拟) 下表是某厂1~4月份用水量(单位:百吨) 的一组数据:
^由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y =-0.7x +a ,则a 等于( )
A .10.5 C .5.2 [答案] D
[解析] x =2.5,y =3.5, ∵回归直线方程过定点(x ,y ) , ∴3.5=-0.7×2.5+a ,∴a =5.25. 故选D.
2.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵轴上的截距是a ,那么必有( )
A .b 与r 的符号相同 B .a 与r 的符号相同 C .b 与r 的符号相反 D .a 与r 的符号相反 [答案] A
[解析] 因为b >0时,两变量正相关,此时,r >0;b
①随机误差是引起预报值与真实值之间的误差的原因之一; ②残差平方和越小,预报精度越高;
③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.
其中真命题的个数是( ) A .0
B .1 B .5.15 D .5.25
C .2 [答案] D
D .3
4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲
乙
现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标( ) A .期望与方差 B.正态分布 C .卡方K 2 [答案] A
5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140
名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A .期望与方差 B.排列与组合 C .独立性检验 D.概率 [答案] C
6.(2009·海南宁夏理,3) 对变量x ,y 观测数据(x 1,y 1)(i =1,2,„,10) ,得散点图1;对变量u ,v 有观测数据(u 1,v 1)(i =1,2,„,10) ,得散点图2. 由这两个散点图可以判断.( )
D .概率
A .变量x 与y 正相关,u 与v 正相关 B .变量x 与y 正相关,u 与v 负相关 C .变量x 与y 负相关,u 与v 正相关 D .变量x 与y 负相关,u 与v 负相关 [答案] C
[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力. 用散点图可以判断变量x 与y 负相关,u 与v 正相关.
7.某地2010年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:
数据,就业形势一定是( )
A .计算机行业好于化工行业 B .建筑行业好于物流行业 C .机械行业最紧张
D .营销行业比贸易行业紧张 [答案] B
[解析] 建筑行业的比值小于
6528074570
,物流行业的比值大于,故建筑好于物流. 7651670436
^
8.工人月工资y (单位:元) 关于劳动生产率x (单位:千元) 的回归方程为y =650+80x ,下列说法中正确的个数是( )
①劳动生产率为1000元时,工资约为730元; ②劳动生产率提高1000元时,则工资约提高80元; ③劳动生产率提高1000元时,则工资约提高730元; ④当月工资为810元时,劳动生产率约为2000元. A .1 C .3 [答案] C
[解析] 代入方程计算可判断①②④正确.
9.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1) ,(x 2,y 2) ,„,(x n ,y n ) ,则下列说法中不正确的是( )
^^^--
A .由样本数据得到的回归方程为y =b x +a 必过样本点的中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好
C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好 D .若变量y 和x 之间的相关系数r =-0.9362,则变量y 和x 之间具有线性相关关系 [答案] C
[解析] R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( )
B .2 D .4
A .三维柱形图 B.二维条形图 C .等高条形图 D.独立性检验 [答案] D
[解析] 前三种方法只能直观地看出两个分类变量x 与y 是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.
11.在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型为( )
A .模型1的相关指数R 2为0.75 B .模型2的相关指数R 2为0.90 C .模型3的相关指数R 2为0.25 D .模型4的相关指数R 2为0.55 [答案] B
[解析] 相关指数R 2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.
12.下面是某市场农产品的调查表. 市场供应量表:
) A .(2.3,2.6) C .(2.6,2.8) [答案] C
[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.
二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13.当且仅当r 满足________时,数据点(x i ,y i )(i =1,2,„,n ) 在一条直线上. [答案] |r |=1
[解析] 当数据点(x i ,y i ) 在一条直线上时,y 只受x 的影响,即数据点完全线性相关,此时|r |=1.
^
14.已知一个回归直线方程为y =1.5x +45,x ∈{1,7,5,13,19},则y =__________.
B .(2.4,2.6) D .(2.8,2.9)
[答案] 58.5
1
[解析] 因为x =(1+7+5+13+19) =9,且y =1.5x +45,所以y =1.5×9+45=
558.5.
^^
本题易错之处是根据x 的值及y =1.5x +45求出y 的值再求y ,由y =1.5x +45求得的y 值不是原始数据,故错误.
15.对具有线性相关关系的变量x 和y ,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.
^
[答案] y =17.5+6.5x
^^
[解析] 由数据表得x =5,y =50,所以a =y -6.5x =17.5,即回归直线方程为y =17.5+6.5x .
16.(2010·广东文,12) 某市居民2005~2009年家庭年平均收入x (单位:万元) 与年平均支出Y (单位:万元) 的统计资料如下表所示:
出有__________线性相关关系.
[答案] 13 正
[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.
三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.
(本题满分10分) 为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:
540×(60×200-260×20)
[解析] k =320×220×80×460=
2496960
≈9.638
259072
∵9.638>6.635
∴40岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.
18.(本题满分12分) 一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.
(1)(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?
[解析] (1)用x 表示机器速度,y 表示每小时生产有问题物件数,那么4个样本数据为:--
--^∑x i y i -4x y
(8,5)、(12,8)、(14,9)、(16,11),则x =12.5,y =8.25. 于是回归直线的斜率为b -2
∑x 2i -4x =
25.5^-^-
≈0.7286,a =y -b x =-0.8575,所以所求的回归直线方程为y =0.7286x -0.8575. 35
^
(2)根据公式y =0.7286x -0.8575,要使y ≤10,则就需要0.7286x -0.8575≤10,x ≤14.9019,即机器的旋转速度不能超过14.9019转/秒.
19.(本题满分12分) 在从烟台—大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:
32
[解析] 男人晕船所占比例为×100%=0.386,
83
8
女人晕船所占比例为100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶
32
劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.
由公式得:
115×(32×24-51×8) 2
K =≈1.870.
83×32×40×75
2
因为1.870
20.(本题满分12分) 有两个分类变量X 与Y ,其一组观测的2×2列联表如下表.其中a, 15-a 均为大于5的整数,则a 取何值时有90%以上的把握认为“X 与Y 之间有关系”?
[解析] 查表可知,要使有K 2>2.706, 65[a (30+a ) -(20-a )(15-a )]2而其观测值k =20×45×15×50
13(65a -300) 213(13a -60) 2==k >2.706得a >7.19或a 5且15-a >5,
60×45×5060×90a ∈Z ,所以a =8,9,故当a 取8或9时有90%以上的把握认为“X 与Y 之间有关系”.
[点拨] 首先计算K 2值,由题意K 2>2.706,求得a 的范围,再结合a >5且15-a >5,a ∈Z ,即可求得a 的值.
21.(本题满分12分) 某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:
[解析] 由表中数据画出散点图如图所示.
1
由表中数据得x =(26+18+13+10+4-1) ≈11.67,
61
y +24+34+38+50+64) ≈38.33,
6
222
∑x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1910,∑x 2i =26+18+13
i =1
6
6
i =1
222222
+10+4+(-1) =1286,∑y 2i =20+24+34+38+50+64=10172,所以r ≈-0.97,因
i =1
2
2
2
6
为|r |≈0.97>0.75,所以热茶销售量与气温之间具有很强的线性相关关系.
22.(本题满分14分) 在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:
(1)画出散点图;
(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义? [解析] (1)散点图如图所示.
(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算.
r =
(385-10×5.5) ×(1020953-10×288.7)
19749-10×5.5×288.7
≈0.984>0.75.
这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.