显著性检验
一、计量资料的常用统计描述指标
1.平均数 平均数表示的是一组观察值(变量值)的平均水平或集中趋势。平均数
计算公式: 式中:X为变量值、Σ为总和,N为观察值的个数。
2.标准差(S) 标准差表示的是一组个体变量间的变异
(离散)程度的大小。S愈小,表
示观察值的变异程度愈小,反之亦然,常写成 。标准差计算公式:
式中:∑X2 为各变量值的平方和,(∑X)2为各变量和的平方,N-1为自由度
3.标准误(Sx) 标准误表示的是样本均数的标准差,用以说明样本均数的分布情
况,表示和估量群体之间的差异,即各次重复抽样结果之间的差异。Sx愈小,表示抽样误差愈小,样本均数与总体均数愈接近,样本均数的可靠性也愈大,反之亦然,常写作 。标准误计算公式:
三、显著性检验
抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。
1.显著性检验的含义和原理 显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
2.无效假设 显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处理有效)。
3.“无效假设”成立的机率水平 检验“无效假设”成立的机率水平一般定为5%(常写为p≤0.05),其含义是将同一实验重复100次,两者结果间的差异有5次以上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为p>0.05。若两者结果间的差异5次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为显著,常记为p≤0.05。如果p≤0.01,则认为两组间的差异为非常显著。
(一)计量资料的显著性检验
1.t 检验
(1)配对资料(实验前后)的比较 假设配对资料差数的总体平均数为零。其计算公
式:
(2)两样本均数的比较
计算公式:
式中 为两数均数之差; 为两组合并标准误,计算公式:
1)自由度计算:
两组例数相等,自由度 f = 2n - 2 ;
两组例数不等,自由度
2)概率的确定:t 0.05;;t0.01> t>t0.05,0.01
t 0.01,p
t 0.05和t 0.01是对应某一自由度,概率分别为p=0.05和p=0.01时的t界值,可从t值表上查得。
(二)计数资料的显著性检验
1.χ2检验 适用于二组或二组以上的计数资料的显著性检验。χ2的计算公式:
其中A为实测值,T为理论值。
2.用四格表计算χ2
两组计数资料可用四格表格表示。如A、B两组,A组阳性和阴性反应例数分别为a、b, B组阳性和阴性反应例数分别为c、d,其四格表如表5-10。
表5-10 四格表
组别
A
B
合计 阳性例数 a(Ta) c(Tc) a+c 阴性例数 b(Tb) d(Td) b+d 合计 a+b c+d a+b+c+d 阳性百分率(%) a/(a+b)×100 c/(c+d)×100 (a+c)/( a+b+c+d)×100
其中N = a+b+c+d 。
自由度计算:n′=(R-1)(C-1) (R代表行数,C代表列数,本例R=2,C=2)。
理论值计算:Ta=(a+c)(a+b)/N,Tb=(b+d)(a+b)/N,Tc=(a+c)(c+d)/N,Td=(b+d)(c+d)/N。
概率的确定:χ20.05;χ20.01>χ2>χ20.05 ,0.01
χ20.01 ,p
(一)用Excel数据分析工具进行统计 2
.t-检验
在Excel中提供了三种t-检验方法,分述如下:
(1)t-检验 成对双样本平均差检验。比较两套数据的平均值。但数据必须是自然成对出现的,比如同一实验的两次数据,且必须有相同的数据点个数。两套数据的方差假设不相等。
(2)t-检验 双样本等方差假设。假设两个样本的方差相等来确定两样本的平均值是否相等。
(3)t-检验 双样本异方差假设。假设两个样本的方差不相等来确定两样本的平均值是否相等。
(4)t-检验方法的操作方法 以上三种t-检验方法的操作方法相同,介绍如下(图5-4-4): ① 打开“t-检验”对话框
② 指定“变量1”和“变量2”的输入范围。
③ 选择输出区域。
④ 单击“确定”取得统计结果。
3.方差分析
方差分析一般检验多套数据的平均值来确定这些数据集合中提供的样本的平均值是否也相等。Excel有三种方差分析工具,即:
(1)单因素方差分析 通过简单的方差分析,对两个以上样本进行相等性假设检验。此方法是对双均值检验的扩充。
(2)可重复双因素方差分析 该分析是对单因素分析的扩展,要求对分析的每组数据有一个以上样本,且数据集合必须大小相同。
图5-4-4 t-检验
(3)无重复双因素方差分析 通过双因素方差分析(但每组数据只包含一个样本),对两个以上样本进行相等性假设检验。
(4)单因素方差分析和无重复双因素方差分析操作方法 单因素方差分析和无重复双因素方差分析方法一致,如图5-4-5。
① 打开“单因素方差分析”对话框。
② 定义输入区域,选分组方式为“逐列”,并选中“标志位于第1行”复选框。
③ 定义输出区域和显著水平α,Excel默认α为0.05。
④ 单击“确定”按钮即得统计结果。
(5)可重复双因素方差分析方法如图5-4-6,操作方法如下:
① 打开“可重复双因素方差分析”对话框。
② 定义输入区域。该工具对输入区域内的数据排放格式有两点特殊规定: I 数据组以列方式排放。 II 数据域的第一列和第一行必须是因素的标志。
③
定义输出区域和显著水平α,Excel默认α为0.05。单击“确定”按钮即得统计结果。 图5-4-5 单因素方差分析和无重复双因素方差分析