单因变量方差分析
方差分析
方差分析模型本身就是线性模型的一个特例,一个带着很多哑变量的线性模型,因此,所有关于普通线性回归的理论方法,对方差分析统统适用。
⎧⎧单因素⎪⎪⎪⎪多因素⎪方差分析⎪⎨有交互效应的因素模型⎪⎪多变量方差分析⎪⎪⎪⎪一般线性模型(GLM ) ⎨⎩协变量分析模型⎪
⎧简单回归⎪
⎪⎪⎪多元回归
⎪回归分析⎨⎪⎪多项式回归⎪⎪多变量回归
⎩⎩
与回归分析不同,方差分析需要分类的自变量,且应变量或者协变量必须是连续变量。
方差分析最初是用来检验多个独立正态总体,在方差齐性的前提下,总体均值间的差异是否具有统计意义的一种方法。而今对多个正态总体在方差不齐时,也有方法对总体间的差异进行显著性检验。因此,只要满足多个总体间的独立性和正态性,方差分析就可以用来探讨多个不同实验条件或者处理方法对实验结果有无影响。
单因变量单因素方差分析
为了研究三种不同的铅球教学方法的效果,将某年级三个班中,同龄的各种运动能力基本相同的男生随机分成三组,分别按三种不同方法教学,三个月后,以同样的测试测得各组的成绩,见数据;试问三种教学方法有无区别?
数据格式如上所见;分别有三种教学方式,分为三组,三种方法的观测值分别为11、15、13;其数据的描述性统计见下表。
1、 描述性统计
2、 样本数据正态性检验和方差齐性检验
Analyze-→discriptive statistics→explore
按因子水平分组:即按照三种教学方法分为三组。
这里levene 检验方差齐性,无:代表不进行方差齐性检验,为转换:代表不对数据进行处理直接进行方差齐性检验。
正态性检验的原假设:样本服从正态分布; 方差齐性检验原假设 :三个样本方差齐性;
通过检验我们看到,正态检验和方差齐性检验的检验概率值SIG. 都是大于0.05,那么我们就可以认为三个方法的样本集正态且方差齐性。 3、 进行方差分析
Analyze →compare →one way anova
Options 框:
discriptive:输出各组常用的描述性统计量。
Homogeneity of variance test:用levene 来检验组别方差的相等性,即方差齐性;方差齐性时选择此项。这里是基于均值的levene 齐性检验。
Brown--forsythe:当方差的相等性不成立时,一般使用这个统计量。Welch:当不知道方差的相等与否时,可用此检验。
Post H oc 框:两两比较;进行均值差异的多重比较;可以选择进行各组均值两两比较的方法。方差齐性成立时,有14种方法;方差齐性不成立时,有4种方法可供选择;一般认为games —howell 法比较好一些。
4、输出结果:
齐性检验与前面检验一致;方差分析的P 值小于0.05,拒绝均值相等的原假设,认为各组均值不等。
看显著性一栏,原假设是两两之间均值相等,从显著性数据看出,三种方法检验结果一样,都认为方法一和方法三均值相等,与方法二不相等。
alpha = 0.05 的子集
教学方法
N
1
2
单因变量单因素方差分析的GLM 处理
单因变量单因素嵌套设计中的方差分析
嵌套设计:单因素完全随机试验所分的各个组中,每个组再分成几个亚组子组,每个亚组中有若干观察值。
组 亚组 观察值
11 111 112 113 114. 。。。。11n 12 1 13 ……………………………………………………………………….
。。。
1m 1m1 1m2 1m3………………………1mn 21 ……………………………………………………………………… 22 ………………………………………………………………………
2 23 ………………………………………………………………………
….
2m ………………………………………………………………………. 例:为研究油菜种子包衣剂对油菜生长的影响,用A\B\C\D四种包衣剂处理同一油菜品种的种子,每种包衣剂处理播种三盒,采用完全随机设计,播种20天后每盒测定5株苗高,数据见下;比较不同包衣剂对苗高的影响有无差异。
1、 正态性检验
Analyze →discriptive →
explore
检验结论,服从正态和方差齐性。 2、 方差分析
Analyze →GLM →univariate
在GLM 中可选择实验设计是固定效应还是随机效应
固定效应:当一个自变量的水平个数,包括了该变量所有的水平个数,也就是样本水平数等于总体的水平数。 随机效应:指的是研究的自变量只包含了某部分一些水平,并非总体的所有水平都包含。 在本例中,包衣剂我们只研究四种,所以包衣剂变量属于固定效应,选入固定因子;而盒子号,我们只是选其中的三组,不包含总体的所有水平,所以是随机效应,选入随机因子。
Paste
此举用更改名称,见下表中的主体间效应检验; Run all 3、 结果输出
检验得出,包衣剂的效应不为0;而盒子号效应为0. 说明不同包衣剂间苗高有显著性差异,同一种子包衣剂内盒子间苗高无显著差异。
均值间多重比较
在5%的置信水平下,lsd 检验结果显示四种包衣剂效果各不相同,从均值差值看出,C>A>B>d.
还有其他类型的单因素方差分析,如单因素随机区组设计中的方差分析等,不在叙述。
单因变量多因素方差分析
单因变量双因素方差分析
表中是XX 年XX 月某比赛上某项比赛的临场统计,使用方差分析对对评分项目的裁判员的裁判水平进行评估。
影响打分的因素一是运动员自身,另一个因素是裁判员的水平,本体是一个单因变量双
具体数据见下图
结果:
这里省略方差齐性和正态性检验。
R 方说明,方差分析是线性模型的特例,一个带有哑变量的线性模型。
给分水平从高到低3、4、2、
1.