SPSS相关分析案例讲解

12-15

SPSS相关分析案例讲解

一、两个变量的相关分析：Bivariate 1．相关系数的含义相关分析是研究变量间密切程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量，通常用r 表示。

①相关系数的取值范围在-1 和+1 之间，即：–1≤r≤ 1。

②计算结果，若r 为正，则表明两变量为正相关；若r 为负，则表明两变量为负相关。

③相关系数 r 的数值越接近于 1（–1 或+1），表示相关系数越强；越接近于 0，表示相关系数越弱。如果 r=1 或–1，则表示两个现象完全直线性相关。如果 =0，则表示两个现象完全不相关（不是直线相关）。

④ 3 . 0  r ，称为微弱相关、 5 . 0 3 . 0   r ，称为低度相关、 8 . 0 5 . 0   r ，称为显著（中度）相关、 1 8 . 0   r ，称为高度相关 ⑤r 值很小，说明 X 与 Y 之间没有线性相关关系，但并不意味着 X 与 Y 之间没有其它关系，如很强的非线性关系。

⑥直线相关系数一般只适用与测定变量间的线性相关关系，若要衡量非线性相关时，一般应采用相关指数R。

2．常用的简单相关系数（1）皮尔逊（Pearson）相关系数皮尔逊相关系数亦称积矩相关系数，1890 年由英国统计学家卡尔�6�1皮尔逊提出。定距变量之间的相关关系测量常用Pearson 系数法。计算公式如下：

           n i n i i i n i i i y y x x y y x x r 1 1 2 2 1 )

( )

)( ( （1)

（1）式是样本的相关系数。计算皮尔逊相关系数的数据要求：变量都是服从正态分布，相互的连续数据；两个变量在散点图上有线性相关趋势；样本容量 30  n 。

（2）斯皮尔曼（Spearman）等级相关系数 2 Spearman 相关系数又称秩相关系数，是用来测度两个定序数据之间的线性相关程度的指标。

当两组变量值以等级次序表示时，可以用斯皮尔曼等级相关系数反映变量间的关系密切程度。它是根据数据的秩而不是原始数据来计算相关系数的，其计算过程包括：对连续数据的排秩、对离散数据的排序，利用每对数据等级的差额及差额平方，通过公式计算得到相关系数。其计算公式为：

  1 6 1 2 2     n n d r R （2)

（2）式中， R r 为等级相关系数；d 为每对数据等级之差；n 为样本容量。斯皮尔曼等级相关对数据的要求没有积差相关系数严格，只要两个变量的观测值是成对的等级评定资料，或者是由连续变量观测资料转化得到的等级资料，不论两个变量的总体分布形态、样本容量的大小如何，都可以用斯皮尔曼等级相关来进行研究。

（3）肯德尔（Kendall）等级相关系数肯德尔（Kendall）等级相关系数是在考虑了结点（秩次相同）的下，测度两组定序数据或等级数据线性相关程度的指标。它利用排序数据的秩，通过计算不一致数据对在总数据对中的比例，来反映变量间的线性关系的。其计算公式如下：

  1 4 1     n n i r K （3)

（3）式中， K r 是肯德尔等级相关系数；i 是不一致数据对数；n 为样本容量。

计算肯德尔等级相关系数的数据要求与计算斯皮尔曼等级相关系数的数据要求相同。

3．相关系数的显著性检验通常，我们用样本相关系数 r 作为总体相关系数ρ 的估计值，而 r 仅说明样本数据的 X 与Y 的相关程度。有时候，由于样本数据太少或其它偶然因素，使得样本相关系数 r 值很大，而总体的 X 与 Y 并不存在真正的线性关系。因而有必要通过样本资料来对X 与Y 之间是否存在真正的线性相关进行检验，即检验总体相关系数ρ 是否为零（即原假设是：总体中两个变量间的相关系数为 0）。

3 SPSS 的相关分析过程给出了该假设成立的概率（输出结果中的Sig.）。样本简单相关系数的检验方法为：

当原假设 0 H ：

0   ， 50  n 时，检验统计量为：

2 1 1 r n r Z    （4)

当原假设 0 H ：

0   ， 50  n 时，检验统计量为：

2 1 2 r n r t      2   n df （5)

式中，r 为简单相关系数；n 为观测值个数（或样本容量）。

4．背景材料设有 10 个厂家，序号为 1，2，�6�7，10，各厂的投入成本记为x ，所得产出记为y 。各厂家的投入和产出如表7-18-1 所示，根据这些数据，可以认为投入和产出之间存在相关性吗?

表1 10 个厂家的投入产出单位：万元厂家 1 2 3 4 5 6 7 8 9 10 投入产出 20 30 40 60 20 40 30 60 10 30 10 40 20 40 20 50 20 30 30 70 5．操作步骤 5-1 绘制散点图的步骤（1）选择菜单命令“Graphs”→“Legacy Dialogs”→“Scatter/Dot”，打开 Scatter/Dot 对话框，如图1 所示。

图1 选择散点图窗口（2）选择散点图类型。SPSS 提供了五种类型的散点图。

4 （3）根据所选择的散点图类型，单击“Define”按钮设置散点图。不同类型的散点图的设置略有差别。

①简单散点图（Simple Scatter)

简单散点图的设置窗口如图2 所示。

图2 简单散点图的设置窗口从对话框左侧的变量列表中指定某个变量为散点图的纵坐标和横坐标，分别选入Y-Axis 和X-Axis 框中。这两项是必选项。

可以把作为分组的变量指定到Set Markers by 框中，根据该变量取值的不同对同一个散点图中的各点标以不同的颜色（或形状）。该项可以省略。

把标记变量指定到Label Cases by 框中，表示将标记变量的各变量值标记在散点图的旁边。该项可以省略。

从左侧变量列表框中选择变量到Panel by 框中作为分类变量，可以使该变量作为行（Rows）或列（Columns）将数据分成不同的组，便于比较。该项可以省略。

选择Use Chart Specifications From选项，可以选择散点图的文件模板，单击 5 “File”可以选择指定的文件。

单击“Title”按钮可以对散点图的标题进行设置，单击“Options”按钮可

以对缺失值以及是否显示数据的标注进行设置。

②重叠散点图（Overlay Scatter)

重叠散点图能同时生成多对相关变量间统计关系的散点图，首先根据分类变量的不同取值对原始数据进行分类，然后对各分类数据做简单散点图。重叠散点图的设置窗口如图7-18-3 所示。

图3 重叠散点图的设置窗口从左侧框中选择一对变量进入 Pairs 框中，其中前一个为图的纵坐标变量（Y-Variable），后一个作为图的横轴变量（X-Variable），可以通过点击按钮进行横纵轴变量的调换。

其他设置与同简单散点图都相同。

③矩阵散点图（Matrix Scatter)

矩阵散点图以方形矩阵的形式在多个坐标轴上分别显示多对变量间的统计关系。矩阵散点图的关键是弄清各矩阵单元中的横纵变量。矩阵散点图的设置窗口如图4 所示。

6 图4 矩阵散点图的设置窗口把参与绘图的若干变量指定到Matrix Variables 框中。选择变量的先后顺序决定了矩阵对角线上变量的排列顺序。

其他设置也与简单散点图相同。

④三维散点图（3-D Scatter)

三维散点图生成三个相关变量的三维散点图，由三个坐标轴对应变量的数据决定，它以立体图的形式展现三对变量间的统计关系。设置窗口如图5 所示。

7 图5 三维散点图设置窗口从左侧的变量列表中指定三个变量分别选入Y-Axis、X-Axis、Z-Axis 框中。

其他设置均与简单散点图相同。

⑤单点散点图（Sample Dot)

单点散点图生成单个变量的散点图，显示数值型变量的每一个观测值，这些值都堆积在X 轴附近，由于没有指定Y 轴，所以数据点的Y 坐标没有特殊的含义。设置窗口如图6 所示。

8 图6 单点散点图设置窗口从左侧变量列表中选择一个变量选入X-Axis Variable 框中。其他设置与简单散点图相同。

5-2 计算简单相关系数的操作步骤通过散点图可以初步判断变量是否具有线性趋势。对具有线性趋势的变量计算相应的简单相关系数的步骤如下：

（1）选择菜单命令“Analyze”→“Correlate”→“Bivariate”，打开两变量相关分析的对话框，如图7 所示。

9 图7 两变量相关分析窗口（2）选入需要进行相关分析的变量进入 Variables 框，至少需要选入两个，如选入“投入”、“产出”变量。

（3）在Correlation Coefficients 复选框中选择需要计算的相关系数。主要有：

Pearson 复选框：选择进行积距相关分析，即最常用的参数相关分析；Kendall's tau-b 复选框：计算 Kendall's 等级相关系数；Spearman 复选框：计算 Spearman 相关系数，即最常用的非参数相关分析（秩相关）。

（4）Test of Significance 单选框用于确定是进行相关系数的单侧（One-tailed)

或双侧（Two-tailed）检验，系统默认双侧检验。

（5）Flag significant correlations 用于确定是否在结果中用星号标记有统计学意义的相关系数，一般选中。此时 P

号，P

（6）单击Options 按钮，弹出Options 对话框，选择需要计算的描述统计量和统计分析，如图8 所示。

10 图8 两变量相关分析的Options 子对话框在 Statistics 复选框中定义各变量输出的描述统计量。Means and standard deviations 选项表示每个变量的样本均值和标准差；Cross-product deviations and covariances 选项表示各对变量的离差平方和、样本方差、两变量的叉积离差以及协方差阵。叉积离差为Pearson 相关系数公式中的分子部分；协方差为叉积离差 /（n-1）。

在Missing Values 单选框中定义分析中对缺失值的处理方法，可以是具体分析用到的两个变量有缺失值才去除该记录（Exclude cases pairwise），或只要该记录中进行相关分析的变量有缺失值（无论具体分析的两个变量是否缺失），则在所有分析中均将该记录去除（Excludes cases listwise）。

（7）单击“OK”按钮完成设置，提交运行。

6．结果解析根据背景资料，利用表1 中的数据，建立SPSS 数据文件，分别将变量投入、产出选入Variables 框中，并在Options 子对话框选中Means and standard deviations 选项和Cross-product deviations and covariances 选项，其他选择默认。结果如表2、表3 所示。

6-1 表2 为描述统计量，表3 为相关分析结果。从表3 中可以看出皮尔逊相关系数为0.759，即投入与产出的相关系数为0.759，双侧检验的P 值为0.011，明显小于0.05，拒绝二者不相关的原假设。因此，我们可以得出结论：可以认为投入与产出之间存在正相关，当投入增加时，产出也会相应增加。

表2 描述统计量 Descriptive Statistics 11 Mean Std. Deviation N 投入 22.00 9.189 10 产出 45.00 14.337 10 表3 简单相关系数分析结果 Correlations 投入产出投入 Pearson Correlation 1 .759 * Sig. (2-tailed)

.011 Sum of Squares and Cross-products 760.000 900.000 Covariance 84.444 100.000 N 10 10 产出 Pearson Correlation .759 * 1 Sig. (2-tailed)

.011 Sum of Squares and Cross-products 900.000 1850.000 Covariance 100.000 205.556 N 10 10 *. Correlation is significant at the 0.05 level (2-tailed). 6-2 调用Bivariate 过程命令时允许同时输入两个变量或两个以上变量，但系统输出的是变量间两两相关的相关系数。

二、偏相关分析：Partial 1．偏相关分析的含义在实际问题中，两变量的相关关系往往还要受到其他因素的影响，这些影响有时候会使相关分析的结果变得不那么可靠。因此，引入了偏相关分析的方法。

偏相关分析，也称净相关分析，是指在研究两个变量之间的线性相关关系时，将与这两个变量有联系的其他变量控制不变的统计方法。根据控制变量的个数，偏相关分析分为零阶偏相关分析、一阶偏相关分析、二阶偏相关分析等等。其中，零阶偏相关分析是指没有控制变量的相关分析，即一般的相关分析。一阶偏相关分析是指有一个控制变量的相关分析，二阶偏相关分析是指有两个控制变量的偏相关分析，其他高阶偏相关分析以此类推。

2．偏相关系数 12 进行偏相关分析时要用到偏相关系数。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时，分别同因变量线性相关程度的指标。偏相关系数的取值范围亦在-1~+1 之间，其计算公式分别为：

当有一个控制变量为 2 x 时，变量 1 x 和y 之间的一阶偏相关系数为：

)

1 )( 1 ( 2 2 2 1 2 2 1 2 1 2 1 x x yx x x yx yx x yx r r r r r r      （6)

3．对偏相关系数的检验方法在偏相关分析中，由于两个变量之间的相关系数是在固定（控制）了一个或几个变量后进行的，考虑到这种因素及抽样误差的影响，其检验统计量为：

2 1 2 r k n r t     （7)

式中，r 是特定的偏相关系数；n 为观测值个数；k 为控制变量个数； 2  k n 为自由度。

4．背景材料某汽车制造商从某月中随机抽出 10 天的电力消耗量、温度、日产量等有关资料，数据如表4 所示。结合多年管理经验，对电力消耗量、温度、日产量的关系做出相关分析。

表4 某汽车制造商的电力消耗量、温度、日产量等数据表电力消耗（千瓦) 温度（华氏)

日产量 12 11 13 9 14 10 12 11 14 11 83 79 85 75 87 81 84 77 85 84 120 110 128 101 105 108 110 107 112 119 5．操作步骤 5-1 选择菜单命令“Analyze”→“Correlate”→“Partial”，打开偏相关分析的对话框，如图9 所示。

13 图9 偏相关分析窗口 5-2 选入需要进行偏相关分析的变量进入Variables 框中，至少需要选入两个。

5-3 选择需要在偏相关分析时进行控制的协变量进入 Controlling for 框中，如果不选入，则进行的就是普通的相关分析。

5-4 在Test of Significance 单选框中确定是进行相关系数的单侧（One-tailed)

或双侧（Two-tailed）检验，一般选双侧检验。

5-5 Display actual significance level 复选框用于表示在结果中给出确切的P 值，一般选中。

5-6 单击Options 按钮，弹出Options 对话框，选择需要计算的描述统计量和统计分析。如图10 所示。

14 图10 偏相关分析的Options 子对话框（1）Statistics 复选框用于定义可选的描述统计量。其中，Means and standard deviations 表示每个变量的样本均值和标准差；Zero-order correlations 表示输出包括控制变量在内所有变量的相关矩阵。

（2）Missing Values 单选框用于定义分析中对缺失值的处理方法，可以是具体分析用到的两个变量有缺失值才去除该记录（Exclude cases pairwise），或只要该记录中进行相关分析的变量有缺失值（无论具体分析的两个变量是否缺失），则在所有分析中均将该记录去除(Excludes cases listwise)。系统默认为前者，以充分利用数据。

6．结果解析这里我们选择电力消耗、温度作为待分析变量，把日产量作为控制变量，在 Options 子对话框中选中Means and standard deviations 选项，其他选择系统默认。

具体分析结果见表4、表5 所示。

6-1 表5 偏相关系数表中的结果表明，在控制了日产量变量后，电力消耗与温度之间的偏相关系数为 0.815，概率 P 值为 0.007

之间有高度的相关关系。

表4 偏相关分析描述统计量Descriptive Statistics Mean Std. Deviation N 电力消耗 11.70 1.636 10 温度 82.00 3.887 10 日产量 112.00 8.083 10 表5 偏相关系数表Correlations Control Variables 电力消耗温度日产量电力消耗 Correlation 1.000 .815 Significance (2-tailed)

. .007 df 0 7 温度 Correlation .815 1.000 Significance (2-tailed) .007 . df 7 0 15 6-2 表6 的输出结果是在分析时，除了原有的设置外，在Options 子对话框中还选中Zero-order correlations 选项的分析结果。表6 中结果表明，在没有控制变量的情况下，电力消耗与温度之间的简单相关系数为 0.838，概率 P 值为 0.002

6 Correlations Control Variables 电力消耗温度日产量 -none- a 电力消耗 Correlation 1.000 .838 .361 Significance (2-tailed)

. .002 .305 df 0 8 8 温度 Correlation .838 1.000 .506 Significance (2-tailed)

.002 . .136 df 8 0 8 日产量 Correlation .361 .506 1.000 Significance (2-tailed)

.305 .136 . df 8 8 0 日产量电力消耗 Correlation 1.000 .815 Significance (2-tailed)

. .007 df 0 7 温度 Correlation .815 1.000 Significance (2-tailed) .007 . df 7 0 a. Cells contain zero-order (Pearson)

correlations.

与《SPSS相关分析案例讲解》相关的范文

09-28 09硕5学习研讨小组实施方案

1.分组方式和原则：全班共30名同学，其中包含6名越南留学生。分组时6位越南留学生为一组。其余24名同学以4人为单位分为6组，合计共7个学习研讨小组。要求每位同学必须参加。 2.研讨主题：越南留学生的那一组主要为我们讲述关于越南的一些民俗、历史、文化、娱乐等方面的内容，与我们进行国际交流，增进与国际友人之间的交流与相互了解；除却留学生外的6个小组，此次活动主要围绕“共同学习SPSS”这一主题来进行 ...

06-04 职业学院实训指导

职业学院实训指导课程名称：国际贸易实务温馨提示：下周二上国际贸易实务课时交上实训项目一：国际市场调研【实训目的】通过实训使学生能熟练运用市场调研的方法、技巧进行国际市场调研，并能制作国际市场调研报告【能力训练任务及案例】任务：制作国际市场调研报告案例：学生以小组为单位，根据所选商品制作国际市场调研报告，并以PPT形式进行汇报。【实训方法】 1、实务训练：学生分组汇报国际市场调研 ...

10-22 培训随笔

培训随笔在我满怀期待中，如期盼来了教务主任培训。这次培训对我来说是“久旱逢甘露”，因为我之前在学校工会工作了3年，转任教务工作的一年多时间里，工作中碰到了许多困惑，我和其他学员一样，很珍惜这次难得的学习机会，希望通过此次学习，能学以致用，更好地开展好我们的教学管理工作。培训2天，已然收获很大。今晚，静静的坐下来，回忆、思考、过滤这两天的培训内容。第一天，金科长的授课，记忆深刻，他为我们讲授学校 ...

09-17 管理案例分析大赛策划书

管理案例分析大赛策划书一、活动名称：解析高手二、活动背景：在这竞争的社会里，我们必须学会管理自己，在生活中碰到的难题我们应该找出正确适合的方法去解决它。三、活动目的：丰富社团文化生活，树立协会形象，加强协会成员内部凝聚力。提高协会成员在实际问题上的管理能力，同时锻炼成员的口才、应变能力。四、活动主题：管理、解析、合作五、活动对象：管理协会全体成员六、活动时间：20XX年3月16日或3月 ...

06-21 数学教师教学能力提升培训日记

数学教师教学能力提升培训日记 (一） 6月20日，阴，宁大我来了! 6月19日晚上准备好了本次学习培训的相关日用品，20日早上一早就迫不及待想早一点出发了，早上7点左右带女儿和她同学到外面用完早餐，顺便把她们送到学校，然后到加油站给车加满油，我就准备出发了，车开出之后不久就发现问题来了，导航发不出声音，这可有点难办了，开车时听导航发出的声音，按指令开就行了，不可能边开车边看画面，这个很危险，先自已 ...

06-21 初三复习研讨教研活动总结

初三复习研讨教研活动总结 xx月xx日初三学生外出旅游，我因初一有课，再加上下午xx初中有初三复习研讨的教研活动，学校就没有安排和学生一同外出。中餐吃好之后，我和七年级的李老师一同赴xx初中参加本次的教研活动。对外出参加教研活动，很多教师之所以反感，并不是他们不喜欢参与，主要是参加教研活动之后，相关的课务是一节都不会拉下，都会调到其它时间去上好，再加上批改作业和备课的压力，如此一来就加重了很多教 ...

12-27 会计培训班心得体会

20XX年6月，我们来自中央企业和省、市大中型国有企业的213名总会计师和财务、审计负责人，来到了花园海滨城市和风景如画的厦门国家会计学院，参加了由国资委和厦门国家会计学院联合举办的第五十二期国有企业总会计师岗位培训班。此次培训学习时间飞快，一个月的培训学习就要结束了。报到、拓展训练、学习、考察历历在目。从整个培训过程来看，无论是课程设置，还是师资选配；无论是丰富的学习讨论，还是优美的生活环境，学 ...

01-03 "国培计划"学习总结汇报材料

“国培计划”学习总结汇报材料 11月15日-30日，我有幸赴南京师范大学参加了“国培计划（20xx）安徽省农村中小学骨干教师培训”，15日下午到达报到地点：南京市宁海路都市客栈，我们就住在这个客栈。客栈离南京师范大学大约要走十多分钟的路程。 11月16日上午，“国培计划（20xx）-安徽省农村中小学骨干教师培训项目小学数学班在南京师范大学教育学院报告厅隆重拉开帷幕，来自安徽省巢湖、淮南、六安、滁州 ...

12-22 初中地理课程标准

第一部分　前言(7-9'GEo'1) 一、背景(7-9'GEo'1.1) 　　当今世界，人口、资源、环境问题日益突出，南北发展差距不断扩大，在世界多极化和经济全球化的曲折发展中，和平与发展仍是时代的主题。在我国，要坚持实施可持续发展战略，促进人与自然的协调与和谐，改善生态环境，增强区域经济发展活力，加速现代化进程。这些都给地理课程改革提出了挑战和有待探索的新课题。关注全球性问题和我国新世纪所面临的 ...

08-16 大学生最喜爱的教师事迹简介

大学生最喜爱的教师事迹简介　　李x，体育部副教授，主讲《交谊舞》、《体育舞蹈》、《基础体育课》、《基础理论》。注重师德风范，言传身教、教书育人，认真贯彻课改精神，创新教学方法、通过自学自评、互学互评、自练创编和集体汇报表演等途径，促使学生主动学习，感知体育课里处处有知识，体验学习过程的欢乐与艰辛，学生的诸多能力及创新精神、团队意识不同程度的得到培养与发展。承担或参与多项教学研究项目，多次获得教学 ...

随机推荐

猜你喜欢

SPSS相关分析案例讲解

·学校体卫艺述职报告范文

·未来企业发展战略规划的主要趋势

·2017年社区党员四讲四有对照检查材料

·[优秀作文]小猪存钱罐

·医院收费管理制度

·课程与教学论作业3答案

·零售业上市公司并购重组方式特征及相关监管思考

·冬日的树阅读答案

·师德笔记)

·并列式分论点拟写的五种方法(学生使用稿)

·县贸易局开展治理商业贿赂专项工作情况汇报

·2014年法制科上半年述职报告

·分公司承包经营协议

·"小组合作学习"之反思

·关于感冒药店营业员培训资料1

·万达广场空间构成解析

·我国开办"质量管理工程专业"的意义

·家居建材团购营销策划方案

·2016年质量检验检测现状及发展趋势分析

·健康保险的功能及意义

SPSS相关分析案例讲解

与《SPSS相关分析案例讲解》相关的范文

·学校体卫艺述职报告范文

·未来企业发展战略规划的主要趋势

·2017年社区党员四讲四有对照检查材料

·[优秀作文]小猪存钱罐

·医院收费管理制度

·课程与教学论作业3答案

·零售业上市公司并购重组方式特征及相关监管思考

·冬日的树阅读答案

·师德笔记)

·并列式分论点拟写的五种方法(学生使用稿)

·县贸易局开展治理商业贿赂专项工作情况汇报

·2014年法制科上半年述职报告

·分公司承包经营协议

·"小组合作学习"之反思

·关于感冒药店营业员培训资料1

·万达广场空间构成解析

·我国开办"质量管理工程专业"的意义

·家居建材团购营销策划方案

·2016年质量检验检测现状及发展趋势分析

·健 康 保 险 的 功 能 及 意 义

·健康保险的功能及意义