定性属性数据分析复习题
属性数据分析复习题
一、 填空(每题4分,共20分)
1. 据,名义数据,有序数据
2.
2χ3. 分类数据的检验方法主要有检验和似然比检验
4. 二值逻辑斯蒂线性回归模型的一般形式是ln p =β0+βx 1+ 1+βk x k 1-p
5. 二维列联表的对数线性非饱和模型有种
二、 案例分析题(每题20分,共60分)
2χ1.P40习题二1,给出上分位数0.05(5)=11.07
H 0:p 1=0.3, p 2=0.2, p 3=0.2, p 4=0.1, p 5=0.1, p 6=0.1
2χ2=18.0567>χ0.05(5)=11.07, 落入拒绝域,故拒绝原假设,即认为这些数据与
消费者对糖果颜色的偏好分布不相符
2.P42表3.1独立性检验,给出上分位数χ0.05(1) =3.84 2
H 0:p 1=p 2(即认为肺癌患者中吸烟比例与对照组中吸烟比例相等) H 1:p 1≠
p 2
未连续性修正的:
n (n 11n 22-n 12n 21) 2106(60⋅11-3⋅32) 2
2χ===9.6636>χ0.05(1)=3.84 n 1+n 2+n +1n +263⋅43⋅92⋅142
带连续性修正的:
n n (|n 11n 22-n 12n 21|-) 2106(|60⋅11-3⋅32|-53) 2
2=χ2==7.9327>χ0.05(1)=3.84 n 1+n 2+n +1n +263⋅43⋅92⋅14
均落入拒绝域,故拒绝原假设,即认为肺癌患者中吸烟比例与对照组中吸烟比例不等
3.P83表4.3 独立性检验,给出上分位数χ0.05(2)=5.99 H 0:p ij =p i +p +j (即认为男性和女性对啤酒的偏好无显著性差异) 2
2χ2=90.685>χ0.05(2)=5.99,落入拒绝域,故拒绝原假设,即认为男性和女性对
啤酒的偏好有显著性差异
三、简答(每题10分) 1. 谈谈你对p 值的认识
P
值是:
1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。 P 值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P 值越小,我们拒绝原假设的理由越充分。总之,P 值越小,表明结果越显著。
统计学根据显著性检验方法所得到的P 值,一般以P
2. 写出三维列联表各种独立性之间的关系
⎧⎧(BA , BC ) (A , BC ) ⇒⎨⎪⎩(CA , CB ) ⎪⎪⎧(AB , AC ) ⎪ (A , B , C ) ⇒⎨(B , AC ) ⇒⎨⎩(CA , CB ) ⎪⎪⎧(AB , AC ) ⎪(C , AB ) ⇒⎨⎪⎩(BA , BC ) ⎩