统计与算法初步单元检测(文科)
统计与算法初步单元检测(文科)
本试卷分第Ⅰ卷(选择题) 和第Ⅱ卷(非选择题) 两部分,共150分,考试时间120分钟.
第Ⅰ卷
一、选择题(本大题共10小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.观察下列散点图,则①正相关,②负相关,③不相关,这三句话与散点图的位置相对应的是(
)
图1
A .①②③ B .②③① C .②①③ D .①③②
2.某班的78名同学已编号1,2,3,„,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )
A .简单随机抽样法 B .系统抽样法 C .分层抽样法 D .抽签法
3.(2012·南昌模拟) 阅读如图2所示的程序框图,运行相应的程序,输出的i 值等于(
)
图2
A .3 B .5 C .7 D .9
4.某部门计划对某路段进行限速,为调查限速60 km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图3所示的频率分布直方图.则这300辆汽车中车速低于限速的汽车有(
)
图3
A .75辆 B .120辆 C .180辆 D .270辆
5.选择薪水高的职业是人之常情,假如张伟和李强两人大学毕业有甲、乙两个公司可供选择,现从甲、乙两个公司分别随机抽取了50名员工的月工资的资料,统计如下:
份有挑战性的工作,则他俩分别选择的公司是( )
A .甲、乙 B .乙、甲 C .都选择甲 D .都选择乙 6.图4是计算函数y =
⎧ln (-x ),x ≤-2⎨0,-23
的值的程序框图,在①、②、
③处应分别填入的是( )
A .y =ln(-x ) ,y =0,y =2x B .y =ln(-x ) ,y =2x ,y =0 C .y =0,y =2x ,y =ln(-x )
D .y =0,y =ln(-x ) ,y =2x 图4 7.关于统计数据的分析,有以下几个结论: ①一组数不可能有两个众数;
②将一组数据中的每个数据都减去同一个数后,方差没有变化;
③调查剧院中观众观看感受时,从50排(每排人数相同) 中任意抽取一排的人进行调查,属于分层抽样;
④一组数据的方差一定是正数;
⑤如图5是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在[50,60)的汽车大约是60辆.
则这5种说法中错误的个数是(
)
图5
A .2 B .3 C .4 D .5
8.图6(1)是某县参加2012年高考的学生身高条形统计图,从左至右的各条形图表示学生人数依次记为A 1、A 2、„A 10(如A 2表示身高(单位:cm) 在[150,155)内的人数) .图6(2)是统计图(1)中身高在一定范围内学生人数的一个算法框图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判断框内应填写的条件是( )
图6
A .i
9.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:
A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有95%的把握认为课外阅读量大与作文成绩优秀有关 D .有99%的把握认为课外阅读量大与作文成绩优秀有关
10.(2011·北京高考) 执行如图7所示的程序框图,若输入A 的值为2,则输出的P 值为( )
图7
A .2 B .3 C .4 D .5
第Ⅱ卷
二、填空题(本大题共5小题,每小题5分,共25分.把正确答案填在题中横线上)
11.(2012·成都模拟) 对总数为m 的一批零件抽取一个容量为25的样本,若1
每个零件被抽取的概率为4,则m 的值为________.
12.下表是某厂1~4月份用水量(单位:百吨) 的一组数据:
其线性回^,则a ^=________.
归方程是^y =-0.7x +a
13.某学校共有师生2 400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.
14.图8是样本数据的茎叶图,则该样本数据的众数与中位数之和为________.
图8
15.为了开展“家电下乡”活动,政府调查某地区家庭拥有彩电的情况,从该地区的10万户居民中,随机抽查了96户,这96户拥有彩电的情况如下:
的总户数为________.
三、解答题(本大题共6小题,共75分.解答应写出文字说明、证明过程或演算步骤)
16.(本小题满分12分) 一次科技知识竞赛,两组学生成绩统计如下:
已经算得两个组的平均分都是80分,请你根据所学过的统计知识,进一步判断两个组在这次竞赛中的成绩谁优谁次?并说明理由.
17.(本小题满分12分) 为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:
系?
18.(本小题满分12分) 为研究质量x (单位:克) 对弹簧长度y (单位:厘米) 的影响,对不同质量的6根弹簧进行测量,得如下数据:
(1)(2)如果散点图中的各点大致分布在一条直线的附近,求y 与x 之间的回归直线方程.
19.(本小题满分12分) 某中学高一(2)班甲、乙两名同学自高中以来每场数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人的数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较. 20.(本小题满分13分)(2011·佛山模拟) “世界睡眠日”定在每年的3月21日.2011年的世界睡眠日的主题是“科学管理睡眠”,
图9
以提高公众对健康睡眠的自我管理能力和科学认识.为此某网站2011年3月13日到3月20日持续一周的在线调查,共有200人参加调查,现将数据整理分组如题中表格所示.
(1)画出整理数据的频率分布直方图; (2)睡眠时间小于8小时的概率是多少?
(3)为了对数据进行分析,采用了计算机辅助计算,分析中一部分计算见算法流程图,求输出S 的值,并说明S 的统计意义.
(注:框图中的赋值符号“=”也可写成“←”或“:=”)
21.(本小题满分14分)(2011·天津模拟) 某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻两个月的概率;
(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y ^x +a ^; 关于x 的线性回归方程^y =b
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
^=
(参考公式:b
i =1
∑ (x i -x )(y i -y )
∑ (x i -x )2
n
n
^=y -b ^x ) a
i =1
答案与解析
1【答案】 D
2【解析】 系统抽样适用于个体较多但均衡的总体,学号能被5整除,即将学生均匀分成几部分,又是从某一部分抽出一学生,所以符合系统抽样的定义,又无明显层次差异,也不宜采取分层抽样,故采用系统抽样.
【答案】 B
3【解析】 i =1→s =2; i =3→s =22; i =5→s =138>137, 又i =i +2=7, 故输出的i =7. 【答案】 C
4【解析】 车速≤60 km/h的频率为1-(0.01+0.03) ×10=0.6,故低于限速 的汽车有300×0.6=180辆.
【答案】 C
5【解析】 由表中的信息可知,甲公司的工资标准差远小于乙公司的工资标准差,这表示甲公司的工资比较稳定,张伟想找一份工资比较稳定的工作,会选择甲公司;而乙公司的工资最大值和极差远大于甲公司的工资最大值和极差,李强想找一份有挑战性的工作,会选择乙公司.
【答案】 A
6【解析】 ①处应填 y =ln(-x ) ,②处填y =2x ,故选B. 【答案】 B
7【解析】 一组数中可以有两个众数,故①错;根据方差的计算法知②正确;③属于简单随机抽样,错误;④错误,因为方差可以是零;⑤正确.故错误
的说法有3个.
【答案】 B
8【解析】 身高在160~180之间的人数为A 4+A 5+A 6+A 7,故判断框内应填i
【答案】 C
9【解析】 根据独立性检验的基本思想和有关数据可以知道,有99%的把握认为课外阅读量大与作文成绩优秀有关.
【答案】 D
10【解析】 由框图可知:
31125
P =1,S =1→P =2,S =2→P =3,S 6→P =4,S =12,循环终止.输出P =4.
【答案】 C
251
11【解析】 由m =4,得m =100. 【答案】 100
^=y -b ^x =3.5+0.7×2.5=5.25.
12【解析】 a 【答案】 5.25
13【解析】 设学生的人数为x ,则 160
2 400x =150,x =2 250.
则教师的人数为2 400-2 250=150. 【答案】 150
14【解析】 众数为84,中位数为86,故和为170. 【答案】 170
15【解析】 样本中农村没有彩电的比例为P =中没有彩电的比例为Q =
14
100%=25%,集镇
14+42
4
100%=10%,则该地区没有彩电的总户数约为4+36
53
10525%+105××10%=15 625+3 750=19 375(户) .
3+53+5
【答案】 19 375
16【解】 (1)从众数看,甲为90分,乙为70分,甲组成绩较好;
(2)从中位数看,两组中位数都为80分,但在80分(含80分) 以上,甲组有33人,乙组有26人,甲组人数多于乙组人数,甲组成绩较好;
2(3)从方差看,s 2甲=172,s 乙=256,甲组成绩波动较小,较稳定;
(4)从得满分情况来看,甲组人数6人,乙组人数12人,成绩较好者应为乙组.
17【解】 由列联表中的数据得
2290×(101×20-124×45)χ211.953. 146×144×225×65
∵χ2≈11.953>6.635,
∴有99%以上的把握认为“是否喜欢饮酒与性别有关”.
18【解】 (1)散点图如图所示:
(2)从散点图看出,各点大致分布在一条直线的附近.
列表:
则x =17.5,y ≈9.487.
^^计算得b ≈0.183,a ≈6.283.
于是,回归直线方程为^y =6.283+0.183x .
19【解】 作出茎叶图:
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88. 因此乙同学发挥比较稳定,总体得分情况比甲同学好.
20【解】 (1)频率分布直方图如下图所示:
(2)睡眠时间小于8小时的概率是
P =0.04+0.26+0.30+0.28=0.88.
(3)首先要理解直到型循环结构图的含义,输入m i ,f i 的值后,由赋值语句:S =S +m i f i 可知,流程图进入一个求和状态.
令a i =m i f i (i =1,2,„,6) ,数列{a i }的前i 项和为T i ,
即:T 6=4.5×0.04+5.5×0.26+6.5×0.30+7.5×0.28+8.5×0.10+9.5×0.02=6.70,
则输出S 的值为6.70.
S 的统计意义即是指参加调查者的平均睡眠时间,从统计量的角度来看,即是睡眠时间的期望值.
21【解】 (1)设抽到相邻两个月的数据为事件A .
因为从6组数据中选取2组数据共有C 26=15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,
51所以P (A ) =153(2)由表中数据求得x =11,y =24,
^=18, 由参考公式可得b 7
^=y -b ^x 求得a ^=-30, 再由a 7
1830所以y 关于x 的线性回归方程为^y =7-71501504(3)当x =10时,^y =7|7-22|=7;
78786同样,当x =6时,^y =7,|7-12|=7所以,该小组所得线性回归方程是理想的.