SPSS聚类分析实验报告
SPSS 聚类分析实验报告
一.实验目的:
1、理解聚类分析的相关理论与应用
2、熟悉运用聚类分析对经济、社会问题进行分析、 3、熟练SPSS 软件相关操作 4、熟悉实验报告的书写 二.实验要求:
1、生成新变量总消费支出=各变量之和
2、对变量食品支出和居住支出进行配对样本T 检验,并说明检验结果 3、对各省的总消费支出做出条形图(用EXCEL 做图也行) 4、利用K-Mean 法把31省分成3类 5、对聚类分析结果进行解释说明 6、完成实验报告 三.实验方法与步骤
准备工作:把实验所用数据从Word 文档复制到Excel ,并进一步导入到SPSS 数据文件中。
分析:由于本实验中要对31个个案进行分类,数量比较大,用系统聚类法当然也可以得出结果,但是相比之下在数据量较大时,K 均值聚类法更快速高效,而且准确性更高。
四、实验结果与数据处理:
1. 用系统聚类法对所有个案进行聚类:
生成新变量总消费支出=各变量之和如图所示:
2. 对变量食品支出和居住支出进行配对样本T 检验,如图所示:
得出结论:
3. 对各省的总消费支出做出条形图,如图所示:
4.对聚类分析结果进行解释说明: K 均值分析将这样的城市分为三类: 第一类北京、上海、广东 第二类除第一类第三类以外的
第三类天津、福建、内蒙古、辽宁、山东
第一类经济发展水平高,各项支出占总支出比重高,人民生活水平高。第二类城市位于中西部地区,经济落后,人民消费水平低。第三类城市位于中东部地区,经济发展较好。
初始聚类中心
聚类 2 3
食品支出 衣着支出 居住支出
家庭设备及服务支出 医疗保健支出 交通和通信支出 文化与娱乐服务支出 其它商品和服务支出 总消费支出
1
迭代历史记录 聚类中心内的更改
迭代 1 2 3 4 5 6 7 8 9 10
1 2 3 a
聚类成员
案例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
地区 北京 浙江 天津 福建 广东 河北 山西 吉林 黑龙江 河南 甘肃 青海 宁夏 新疆 内蒙古 辽宁 山东 西藏 广西 海南 四川
聚类
距离
22 23 24 25 26 27 28 29 30 31
云南 安徽 江西 湖北 湖南 重庆 贵州 陕西 上海 江苏
最终聚类中心
食品支出 衣着支出 居住支出
家庭设备及服务支出 医疗保健支出 交通和通信支出 文化与娱乐服务支出 其它商品和服务支出 总消费支出
聚类
1 2 3
最终聚类中心间的距离
聚类 1 2 3
1
2 3
每个聚类中的案例数 聚类
1 2 3
有效 缺失
实验结果分析:
第一类城市经济发展最好,第二类城市经济最落后。国家应加大对于第二类城市经济发展的扶持力度,努力缩小经济发展差距,实现地区的公平。