[独立性检验的基本思想及其初步应用]教案2
课题:独立性检验的基本思想及其初步应用(第一课时)
教学目标:1、理解独立性检验的基本思想;
2、会从列联表、柱形图、条形图直观判断吸烟与患肺癌有关; 3、了解随机变量K2的含义。
教学重点:理解独立性检验的基本思想。 教学难点:1、理解独立性检验的基本思想;
2、了解随机变量K2的含义。
教学手段:多媒体课件。 教学方法:讲练结合。 教学过程:
一、 引入:
问题:某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌, 2099人不患肺癌;不吸烟的7817人中42人患肺癌, 7775人不患肺癌。
根据这些数据能否断定:患肺癌与吸烟有关?
从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会
在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。
通过数据和图表分析,得到结论是:吸烟与患肺癌有关。 但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
二、 独立性检验就是检验两个分类变量是否有关的一种统计方法: 用字母表示吸烟与患肺癌的列联表: 不患肺癌 患肺癌 合计 不吸烟 a b a+b 吸烟 c d c+d 合计 a+c b+d a+b+c+d 样本容量 n=a+b+c+d
假设H0 : 吸烟与患肺癌没有关系。则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:
ac
acdcabadbc0abcd
因此 : adbc 越小, 说明吸烟与患肺癌之间关系越弱.nadbc
构造随机变量 k2 其中
abcdacbdnabcd
2
作为检验在多大程度上可以认为“两个变量有关系”的标准 。
若H0成立,则K2应该很小. 把表中数据代入公式9965777549-422099K2=56.632
78172148987491
在H0成立的情况下.统计学家估算出如下概率PK26.6350.01
即在H0成立的情况下,K2的值大于6.635的概率非常小.如果K26.635,就断定H0不成立,出错的可能性有多大?出现K2=56.6326.635 的概率不超过1% .
因此,我们有99%的把握认为
2
三、结论: 2×2列联表
2
2nadbc
Kabcdacbd P(K2k)
1)如果P(k>10.828)= 0.001表示有99.9%的把握认为“X与Y”有关系; 2)如果P(k> 7.879)= 0.005表示有99.5%的把握认为“X与Y”有关系; 3)如果P(k> 6.635)= 0.01 表示有 99% 的把握认为“X与Y”有关系; 4)如果P(k> 5.024)= 0.025表示有97.5%的把握认为“X与Y”有关系; 5)如果P(k> 3.841)= 0.05 表示有 95% 的把握认为“X与Y”有关系; 6)如果P(k> 2.706)= 0.10 表示有 90% 的把握认为“X与Y”有关系; 7)如果P(k≤2.706) , 就认为没有充分的证据显示“X与Y” 有关系。 用 K^2 统计量研究这类问题的方法称为独立性检验。
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和2(如患病与不患病)。于是得到
(1)提出假设H0 :Ⅰ和Ⅱ没有关系;
(2)根据2× 2列表与公式计算K^2 的值; (3)查对临界值,作出判断。
由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 K^2进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。
四、应用举例:
例1.在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能五、作业:P21习题1.2的1、2和预习18页。
课后记: