SPSS处理多元方差分析
实验三 多元方差分析
一、实验目的
用多元方差分析说明民族和城乡对人均收入和文化程度的影响。
二、实验要求
调查24个社区,得到民族与城乡有关数据如下表所示,其中人均收入为年均,单位百元。文化程度指15岁以上小学毕业文化程度者所占百分比。试依此数据通过方差分析说明民族和城乡对人均收入和文化程度的影响。
三、实验内容
1.依次点击“分析”---- “常规线性模型”----“多变量”,将“人均收入”和“文化程度”加到“因变量”中,将“民族”和“居民”加到“固定因子”中,如下图一所示。
【图一】
2.点击“选项”,将“输出”中的相关选项选中,如下图二所示:
【图二】
3.点击“继续”,“确定”得到如下表一的输出:
【表一】
常规线性模型
描述性统计量 人均收入
民族 1
居民 农村 城市 总计
2
农村 城市 总计
3
农村 城市 总计
总计
农村 城市 总计
文化程度
1
农村 城市 总计
均值 56.0000 64.2500 60.1250 59.7500 67.2500 63.5000 62.0000 70.2500 66.1250 59.2500 67.2500 63.2500 82.7500 90.2500 86.5000
标准差 9.93311 11.02648 10.66955 8.99537 9.10586 9.28901 7.61577 7.84750 8.40812 8.45442 8.89458 9.41899 10.68878 7.93200 9.59166
N
4 4 8 4 4 8 4 4 8 12 12 24 4 4 8
主体间因子
2 农村 城市 总计
80.0000 85.7500 82.8750 73.2500 80.7500 77.0000 78.6667 85.5833 82.1250
8.28654 8.18026 8.21910 7.13559 8.77021 8.41767 9.00841 8.53291 9.27977
4 4 8 4 4 8 12 12 24
3 农村
城市 总计
总计 农村 城市 总计
协方差矩阵等同性的 Box 检验(a) 检验零假设,即观测到的因变量的协方差矩阵在所有组中均相等。 a 设计: Intercept+A+B+A * B
多变量检验(d)
偏 Eta
效应 截距
Pillai 的
跟踪 Wilks 的
Lambda Hotelling
的跟踪
1832.265
2.000
17.000
1832.265
2.000
17.000
值
F 1832.265
2.000
17.000
假设 df
误差 df
Sig.
方
非中心。参
数
观察到的幂(a)
3664.530 3664.530 3664.530
Roy 的最
大根
A
Pillai 的
跟踪 Wilks 的
Lambda Hotelling
的跟踪 Roy 的最
大根
B
Pillai 的
1832.265
2.000
17.000
3664.530
4.000 36.000 29.511 18.305(b
4.000
34.000
73.221
4.000 32.000 142.882 80.356(c
2.000
18.000
160.712
跟踪 Wilks 的
Lambda Hotelling
的跟踪 Roy 的最
大根
A * B
Pillai 的
跟踪 Wilks 的
Lambda Hotelling
的跟踪 Roy 的最
大根
a 使用 alpha 的计算结果 = .05 b 精确统计量
2.000 17.000 4.397 2.000 17.000 4.397 2.000 17.000 4.397 2.000 17.000 4.397 4.000 36.000 .282 4.000 34.000 .268 4.000 32.000 .253 2.000 18.000 .284 c 该统计量是 F 的上限,它产生了一个关于显著性级别的下限。 d 设计: Intercept+A+B+A * B
误差方差等同性的 Levene 检验(a)
检验零假设,即在所有组中因变量的误差方差均相等。 a 设计: Intercept+A+B+A * B
4.实验结果分析
在“协方差矩阵等同性的 Box 检验(a)”中可以看出,p=0.887,大于0.05,故接受原假设,即认为方差是齐性的,可以进行方差分析。
在“多变量检验”中,仅以wilks的Lambda为例进行分析,在效应A中p值接近0,故拒绝原假设,认为民族(A)对文化水平和收入有显著影响,在效应B中p=0.142,故接受原假设,即认为B(居民)对对文化水平和收入没有显著影响。在A*B中,p=0.991,大于0.05,故接受原假设,即认为AB的交互作用对文化水平和收入的影响不显著。
故应该不考虑交互作用,重新改进该试验。
步骤如下:
1.第一、二步和前面一样,只需要点击“模型”,将“全因子”改为“定制”,“建立项”中改为“主效应”接着将“A,B”添加到“模型”中,如下图三所示:
【图三】
2.点击“继续”“确定”,得到如下表二结果:
【表二】
常规线性模型
主体间因子
协方差矩阵等同性的 Box 检验(a) 检验零假设,即观测到的因变量的协方差矩阵在所有组中均相等。 a 设计: Intercept+A+B
多变量检验(d)
观察到的幂
效应 截距
Pillai 的跟踪
.995
Wilks 的
.005
Lambda
2020.700(
2.000
.000
.995
4041.400
1.000
值
F 2020.700(
2.000
.000
.995
4041.400
1.000
假设 df
误差 df
Sig.
偏 Eta 方 非中心。参数
(a)
Hotelling 的跟
212.705
踪
2020.700(
2.000
2020.700(
212.705
2.000
.000
.995
4041.400
1.000
.000
.995
4041.400
1.000
Roy 的最大根
A
Pillai 的跟踪 Wilks 的
.900 4.000 .000 .450 32.702 .996
.102 Lambda
Hotelling 的跟
8.802
踪
B
Roy 的最大根 Pillai 的跟踪 Wilks 的
.795
Lambda
Hotelling 的跟
.259
踪
Roy 的最大根
a 使用 alpha 的计算结果 = .05 b 精确统计量
.259
8.800 .205
4.000 .000 .681 81.059 1.000
4.000 .000 .815 158.434 1.000
2.000 2.000
.000 .112
.898 .205
176.004 4.914
1.000 .433
2.000 .112 .205 4.914 .433
2.000 .112 .205 4.914 .433
2.000 .112 .205 4.914 .433
c 该统计量是 F 的上限,它产生了一个关于显著性级别的下限。 d 设计: Intercept+A+B
主体间效应的检验
观察到的幂
源
因变量
III 型平方和
528.750(b) 654.792(c) 96013.500 161868.375
df
均方 F 2.332 3.292 1270.230 2441.761
Sig. .105 .042 .000 .000
偏 Eta 方 非中心。参数
.259 .331 .984 .992
6.995 9.877 1270.230 2441.761
(a) 校正模型 人均收入 截距
文化程度 人均收入 文化程度
161868.37
A B 误差 总计 校正的总计
文化程度
1980.625
人均收入 文化程度 人均收入 文化程度 人均收入 文化程度 人均收入 文化程度 人均收入
2040.500
144.750 367.750 384.000 287.042 1511.750 1325.833 98054.000 163849.000
.957 2.774 5.080 4.330
.401 .086 .036 .051
.087 .217 .203 .178
1.915 5.547 5.080 4.330
a 使用 alpha 的计算结果 = .05 b R 方 = .259(调整 R 方 = .148) c R 方 = .331(调整 R 方 = .230) 主体间 SSCP 矩阵 假设
截距
人均收
96013.500
入 文化程度
A
人均收
144.750
入 文化程
-225.750
度
B
人均收
384.000
入 文化程
332.000
度
287.042 332.000 367.750 -225.750
124665.75
161868.37
5
人均收入
文化程度 124665.75
误差 人均收
1511.750
入 文化程
1360.000
度
1325.833 1360.000
基于 III 型平方和
3.实验结果分析
去掉A与B的交互作用后,在“协方差矩阵等同性的 Box 检验(a)”表格中,p=0.887,大于0.05,故接受原假设,即认为方差是齐性的,可以进行方差分析。
在“多变量检验”中,仅以Wilks的Lambda为例进行分析,在效应A中p值接近0,故拒绝原假设,认为民族(A)对文化水平和收入有显著影响,在效应B中p=0.205,故接受原假设,即认为B(居民)的不同对文化水平和收入没有显著影响。
在“多变量检验”中,“A”与“人均收入”的p=0.401,大于0.05,故接受原假设,即认为民族的不同对人均收入没有显著影响,“A”与“文化程度”的p=0.086,大于0.05,故接受原假设,即认为民族的不同对文化程度没有显著影响,但这个显著性强于对人均收入的显著性。同样,可以分析出,居民的身份(农村或城市)对人均收入有显著影响,但对文化程度没有显著影响。
四、存在问题与解决情况
本次试验主要进行多元方差分析,主要对“协方差矩阵等同性的 Box 检验(a)”,“多变量检验”和“多变量检验”中的数据进行分析,和以往一样,都是通过p值来判断是否接受原假设。
现将一些实习后的收获总结如下:
在此实验中要注意,第一方差分析后发现其交互作用对文化程度和收入水平影响不显著,因此应将其去掉,再此进行方差分析。
由于总是对原假设难以把握,故将其列在此,以提醒自己:
1.在“协方差矩阵等同性的 Box 检验(a)”中,原假设是:方差是齐性的,可以进行方差分析。
2.在“多变量检验”和“多变量检验”中,原假设是:两因素间的影响不显著。
附:记H为总的组间离差阵
1.Pillai’s trace
Pillai’s trace = traceH(H
2.Hotelling-Lawley’s trace E为组内离差阵 1E)
Hotelling-Lawley’s trace = trace(HE1)
3.Wilk’s lambda
Wilk’s lambda =E
HE
4.Roy’s largest root
Roy’s largest root = 1
11 。其中1为HE1的最大特征根
其中:Pillai’s trace是最为稳定的,值恒为正数,值越大表示该效应对模型的贡献越大。 Hotelling-Lawley’s trace检验矩阵的特征根之和,值越大贡献越大。 Wilk’s lambda 值在0-1之间,值越小贡献越大。 Roy最大根统计量,为检验矩阵特征根中最大值,值越大贡献越大。