排序题的统计分析
排序题的统计分析
【说明】这里的排序题指的是封闭性排序题,排序题是一种特殊形式的多项选择题,因此,对于排序题的统计分析有很多之处与普通多项选择题类似,某些环 节就是重复做几次而已
一个排序题相当于若干个子问题,实际上就是问排在第1的是哪项,排在第2„n 的是哪项, 也就是第1个选项排在第几位,第2„m 选项排在第几位。因此,设置子问题有两个角度:一是根据题项,二是根据选项。
采用第一种方法设置子问题时,设置出来的问题数等于排位数,即题中要求的排出;第二种方法设置子问题时,设置出来的问题数等于选项数。下面以这个问题“请从下列5个运动鞋品牌中选出你第3喜欢的品牌,并按喜欢的程度最高到低排列: 李宁 安踏 361 双星 鸿星尔克”来说明这两种方法的操作:
第一种方法:上述问题相当于下面3个问题
1. 请从下列5个运动鞋品牌中选出你第1喜欢的品牌:
A 李宁 B安踏 C361 D双星 E鸿星尔克
2. 请从下列5个运动鞋品牌中选出你第2喜欢的品牌:
A 李宁 B安踏 C361 D双星 E鸿星尔克
3. 请从下列5个运动鞋品牌中选出你第3喜欢的品牌:
A 李宁 B安踏 C361 D双星 E鸿星尔克
第二种方法:上述问题相当于下面5个问题
1. 在李宁、安踏、361、鸿星尔克、双星5个运动鞋品牌中,你喜欢李宁的程度如何?( )
A 不在前3名 B排在第1 C排在第2 D排在第3
2. 在李宁、安踏、361、鸿星尔克、双星5个运动鞋品牌中,你喜欢安踏的程度如何?( )
A 不在前3名 B排在第1 C排在第2 D排在第3
3. 在李宁、安踏、361、鸿星尔克、双星5个运动鞋品牌中,你喜欢361的
程度如何?( )
A 不在前3名 B排在第1 C排在第2 D排在第3
4. 在李宁、安踏、361、鸿星尔克、双星5个运动鞋品牌中,你喜欢鸿星尔克的程度如何?( )
A 不在前3名 B排在第1 C排在第2 D排在第3
5. 在李宁、安踏、361、鸿星尔克、双星5个运动鞋品牌中,你喜欢双星的程度如何?( )
A 不在前3名 B排在第1 C排在第2 D排在第3
无论采用那种方法设置子问题,各子问题的选项是一致的,并且顺序必须一致,这样是为了在数据录入时输入的数据具有可比性。
一个排序题相当于若干个子问题,因此,对排序题的编码是对构成其的各个子问题的备选项进行编码,同样,在建立数据库时,对排序题设置变量就是对构成其的各个子问题设置变量,这意味着对一个排序题需要设置若干个(选项数量或排位数,即子问题数量)子变量。
对于“请从下列5个运动鞋品牌中选出你第3喜欢的品牌,并按喜欢的程度最高到低排列: 李宁 安踏 361 双星 鸿星尔克”这个问题,下面从采用第二种方法设置子问题的角度来讲解编码、设置变量、数据录入以及统计分析。
对采用第二种方法设置的5个子问题的选项的编码我们可以如下设置:不在前3名(0) 排在第1 (1) 排在第2(2) 排在第3(3),对5个子问题设置的变量分别为LN 、AT 、SLY 、SHX 、HXEK (当然也可以是其他的,这些变量分别用来衡量作答者李宁、安踏 、361、双星、鸿星尔克各品牌在五个品牌中喜欢的程度位置)。作答者在排序题中将哪个选项排在第1位,则该选项对应的子问题的答案是B ,在数据库中输入数据时, 相应变量的数据为1; 将哪个选项排在第2位,则该选项对应的子问题的答案是C ,在数据库中输入数据时, 相应变量的数据为2,将哪个选项排在第3位,则该选项对应的子问题的答案是D ,在数据库中输入数据时, 相应变量的数据为3;对于作答者在排序题中没有选中的选项,其对应的子问题的答案是A ,在数据库中输入数据时, 相应变量的数据为0。
输入数据完后,统计分析有两种方法:
第一种方法就是,点击“Analyze →Descriptives Statistics → Descriptives ”或“Analyze →Descriptive Statistics→ Frequencies ”,二者的区别在于输出结果是否涉及图/表以及涉及到的指标不一样(具体的差异大家可以进行观察比较)。使用这两个命令可以一个一个变量单独进行操作,也可以多项同时进行操作(输出的结果及图/表是按照一个一个变量展开,即所有变量的统计结果可以一次输出,但不会出现在一张图/表中)
第二种方法与将各变量合并成若干个(排位数)对一定数字进行计数的新变
量,然后,再执行一定的命令即可输出结果,与第一种方法相比,输出的结果不会涉及到图以及各变量的统计结果会集中在一种表中反映等。具体如下:
将各变量合并成若干个(排位数)对一定数字进行计数的新变量:点击“analyse e →multiple response →define sets ”,将”set definition” 框中所需要合并的变量送入右框,在“dichotomies counted value ”后框中 输入计数的数字(在上例中,我们需要统计的是各品牌在五个品牌中的喜欢程度位置,即统计排在第1的品牌情况、排在第2的品牌情和排在第3的品牌情况,不,而1代表第1喜欢,2代表第2喜欢,3代表第3喜欢,0代表不在前3,所以需要输入1、2、3,注意1、2、3不是一次输入,而是分三次输入,从而生生成三个新变量),并在name 后框中输入新变量的名称(变量反映排在第1/2/3的品牌情况),如下图所示:
完成上述步骤后,点击add 并点击close 。【注意:定义一个新变量点击一次add ,待所有的新变量都定义完毕并点击了add 后再点击close 】。所有的新变量都定义完毕并点击了add 后,出现如下图表:
执行一定的命令即可输出结果:在“analyse e→multiple response →define sets→ Frequencies”,将刚才定义的变量从左框送入右框(如 下图所示),点击ok 即可。定义的变量可以一个一个单独进行统计,也可
以一次性进行统计(输出的结果按变量列示,即一个变量对应一个表格)。
【与多项选择题的比较】:原理一致,编码的数量增加,采用第二种方法进行统计分析时需要定义多个新的变量
【练习】请从采用第二种方法设置子问题的角度进行编码、变量设置、数据录入以及统计分析相关演练(补充:从这个角度进行统计时,相关数字的含义发生了变化,新变量的含义也发生了变化,请大家进行具体比较)
【补充说明】对于相关窗口中的参数选项请大家在操作的过程中进行比较
【特别说明】采用第二种方法是针对各子问题的变量都必须设置成数字型