医学统计学复习题一及答案
医学统计学复习题一
一、名词解释
1. 变异即同质的观察单位之间某项特征所存在的差异
2. 等级资料 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
3. 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数
4. 统计量:样本的统计指标,如样本均数、标准差, 参数附近波动的随机变量
5. 算术均数 简称均数,描述一组同质计量资料的平均水平。统计学中常用希腊字母μ表示总体均数,用x表演示样本均数
6. 中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值
7. 百分位数 :将顺序排列的一组观察值分为一百等分,位于某百分位置上的数值,以Px表示,它是一种位置指标,理论上有x%的观察值比它小,有(100-X)%的观察值比它大。
二、单项选择
1.表示事物内部各个组成部分所占比重的相对数是( b )。
A.相对比 B.率 C.构成比 D.率的标准误 E.均数
2.说明样本均数抽样误差大小的指标是( c )。
A.变异系数 B.标准差 C.标准误 D.全距 E 四分位数间距
3.正态分布曲线下中间面积为95% 的变量值范围为( a )。
A.196. B.2.58 C.1 D.125. E.2
4.在两样本均数假设检验中,P ≤α时,拒绝H0,认为( b )。
A.两样本均数有差别 B.两总体均数有差别 C.两样本均数无差别
D.两总体均数无差别 E.两总体均数差别很大
5.下述( c )种资料为计数资料。
12A.血红蛋白(g/L) B.红细胞计数(×10/L) C.抗体滴度 D.血型
E.身高(cm)
6.某地某年肺癌死亡率城区为郊区的194.1%,本指标是( b )。
A.率 B.构成比 C.相对比 D.中位数 E.百分率
7.用均数和标准差可全面描述( b )资料的特征。
A.正偏态分布 B.正态分布和近似正态分布 C.负偏态分布 D.t分布
2E.χ分布
8.四格表的自由度( b )。
A.不一定等于1 B.一定等于1 C.等于行数×列数 D.样本量减1 E.以上都不对
9.等级资料比较宜用( d )。
2A.t检验 B.检验 C.u检验 D.秩和检验 E.方差分析
10.某项生化指标仅以过低为异常,且数据分布呈明显偏态,则在制订该指标 95%正常值范围时,应计算( a )。
A.P2.5和P97.5 B.P95 C.P5 D.P5和P95 E.P50
11.要反映某一城市连续五年甲肝发病率的变化情况,宜选择的统计图是( b )。
A.直条图 B.线图 C.直方图 D.圆图 E.散点图
12.等级资料的比较适宜用( b )。
A.t检验 B.秩和检验 C.F检验 D.四格表χ检验 E.R×C表x检验
13.在进行成组设计的t检验之前,要注意两个前题条件,一是各样本是否来自正态总体,二是( b )。
A.核对数据 B.总体方差是否相等C.求作变量变换 E.处理缺失值 x、sx和s14.两样本均数的比较,P
A.有差别B.差别非常大C.无差别D.差别较大E.差别有实际意义
15.两样本均数的比较,不能用( b )。
2A.方差分析 B.t检验C.x检验 D.方差分析或t检验 E.u检验
16.完全随机设计方差分析中( d )。
A. 组间SS不会小于组内SS B. 组内SS不会小于组间SS
C. 组间MS不会小于组内MS D. F值不可能是负数 E. F值可能是负数
17. 方差分析中,当P
A.t检验B.u检验C.t′检验D.F 检验E.q检验
18.q检验中,q值与p值的关系为( c )。
A.q值越大则p值越大B.q值越小则p值越小C.q值越大则p值越小
D.q值与p值无关 E.以上都不对
19.等级资料的比较适宜用( b )。
22A.t检验 B.秩和检验 C.F检验 D.四格表x检验 E.R×C表x检验
20.非参数统计应用条件是( c )。
A. 总体属于某种已知的分布类型 B.若两组比较,要求两样本方差相等
C.总体分布类型未知D.要求样本例数很大E.样本数据来自正态总体
21.两个小样本计量资料比较的假设检验,应首先考虑( b )。
2A.资料符合哪种检验的条件B.秩和检验C.任选一种检验方法D.t检验E.x检验
22.配对比较的秩和检验的基本思想是:如果假设检验成立,则对样本来说(c )。
A.正秩和的绝对值小于负秩和的绝对值B.总的秩和等于零
C.正秩和的绝对值与负秩和的绝对值不会相差很大
D.正秩和的绝对值与负秩和的绝对值相等 E.正秩和的绝对值大于负秩和的绝对值
23. 秩和检验和t检验相比,其优点( e )。
A.计算更简便B.公式更为合理C.检验效能高D.抽样误差小E.不受分布限制
24.直线回归系数假设检验t检验其自由度为( a )。
A. n-2 B. n-1 C. n D. 2n-1 E. 2(n-1)
25. 如果求得的样本相关系数γ≠0.则( )。
A.两变量间有相关关系 B.两变量间无相关关系 C.|γ|大时就有统计学意义
D.n大时γ就有统计学意义 E.对γ作假设检验后才能推论
26.比较1956年某地三种传染病白喉、乙脑和痢疾的病死率,宜选择的统计图是(c )。
A.线图B.半对数线图C.直方图D.直条图E.百分条图 22
三、简答题
1.统计分析要求每一个样本应该具有哪四个特性。
为了使样本能够正确反映总体情况,对总体要有明确的规定;总体内所有观察单位必须是同质的;在抽取样本的过程中,必须遵守随机化原则;样本的观察单位还要有足够的数量
2.简述频数分布表的编制方法及其主要用途。
频数分布表编制的基本步骤:(1)计算全距。(2)确定组距。(3)划分组段。
(4)统计频数。(5)确定频率与累计频率。
频数分布表的主要用途:(1)揭示资料的分布类型。(2)观察资料的集中趋势和
离散趋势。(3)便于发现某些特大或特小的离群值。(4)便于进一步计算统计指标和做统计处理。
3.简述医学参考值范围的涵义。
医学参考值:是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。由于个体存在差异,生物医学数据,并不是常数,而是在一定范围内波动,故采用医学参考值范围作为判定正常还是异常的参考标准。
参考值范围也称为正常值范围,是指绝大多数“正常人”的某指标值范围。这里的“绝大多数”可以是90%、95%、99%等,最常用的是95%。所谓“正常人”不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。 参考值范围的制定方法: 1.决定参考值范围的单双侧 根据一个指标是否过大、过小均属异常,决定该指标的参考值范围是双侧范围还是单侧范围。若一个指标过大、过小均属异常,则相应的参考值范围既有上限又有下限,是双侧参考值范围;若一个指标仅过大属异常,则此指标的参考值范围只有上限,是单侧参考值范围;若一个指标仅过小属异常,则此指标的参考值范围只有下限,也是单侧参考值范围。 2.利用大样本资料制定参考值范围 随机抽取一个大样本后,如果指标服从正态分布,就采用正态分布法制定其参考值范围。如果指标不服从正态分布,就采用百分位数法。
4简述标准正态分布和正态分布的区别与联系。
1)区别:正态分布的平均数为μ。标准差为σ;不同的正态分布可能有不同的μ值和σ值,正态分布曲线形态因此不同。标准正态分布平均数μ=0,标准差σ=1.μ和σ都是固定值;标准正态分布曲线形态固定。
(2)联系:正态分布可以通过标准化处理.转化为标准正态分布。具体方法是使用z=(X-μ)/σ将原始数据转化为标准分数
5.样本均数的抽样分布有哪些特点?
样本均值的抽样分布是所有的样本均值形成的分布,即μ的概率分布。样本均值的抽样分布在形状上却是对称的。随着样本量n的增大,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值μ,方差为总体方差的1/n。这就是中心极限定理(central limit theorem)
6.两样本均数比较的假设检验,在0.02
7.方差分析对数据有什么要求?
应用方差分析对资料进行统计推断之前应注意其使用条件,包括: 1、可比性。若
资料中各组均数本身不具可比性则不适用方差分析。
2、正态性。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。
3、方差齐性。即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。
8.两样本t检验与完全随机设计方差分析有何联系与区别?
t检验只能用于两样本均数及样本均数与总体均数之间的比较。 方差分析可以用于两样本及以上样本之间的比较。 联系:
1、两者都要求比较的资料服从正态分布;
2、而且两样本均数的比较及方差分析均要求比较组有相同的总体方差;
3、配伍组比较的方差分析是配对比较t检验的推广,成组设计多个样本均数比较的方差分析是两样本均数比较t检验的推广;
4、对于两个样本之间的比较,方差分析和t检验效果是相同的,且有:$sqrt(F)=t$。
9.常用的相对数指标有哪些?请说明各种相对数的含义、计算方法和特点?
相对指标按其作用不同可划分为六种:结构相对指标、比例相对指标、强度相对指标、动态相对指标、比较相对指标和计划相对指标。
结构相对指标 又称结构相对数。总体的某一部分与总体数值相对比求得的比重或比率指标。结构相对数通常用来反映总体的结构和分布状况等。实际经济工作中常用的恩格尔系数、贡献率、城市化程度、中间投入率、增加值率、消费率、合格率、市场占有率等都是结构相对数。
比较相对指标 又称比较相对数或同类相对数。同类指标在不同空间进行静态对比形成的相对指标。可以比较不同国家、不同地区、不同单位等经济实力、发展水平和工作优劣。 比例相对指标 又称比例相对数或比例指标。反映总体中各组成部分之间数量联系程度和比例关系的相对指标。
强度相对指标 又称强度相对数。有一定联系的两种性质不同的总量指标相比较形成的相对指标。通常以复名数、百分数(%)、千分数(‰)表示。
动态相对指标 动态相对指标又称“动态相对数”或“时间相对指标”,就是将同—现象在不同时期的两个数值进行动态对比而得出的相对数,借以表明现象在时间上发展变动的程度。通常以百分数(%)或倍数表示,也称为发展速度。 发展速度减1或100%为增长速度指标,计算结果大于100%为增长多少百分数或百分点,小于100%为下降多少百分数或百分点。
其计算公式如下:
动态相对指标=(报告期指标数值÷基期指标数值)×100%
通常,作为比较标准的时期称为基期,与基期对比的时期称为报告期。例如,2001年我国国内生产总值为95533亿元,2000年为89404亿元,如果2000年选作基期,亦即将2000年国内生产总值作为100,则2001的国内生产总值与2000年的国内生产总值对比,得出动态相对数为106.9%,它说明在2000年基础上2001年国内生产总值的发展速度。
计划完成程度指标 又称计划完成百分数。以计为比较标准,将实际完成数与计划规定数相比较,用以表明计划完成情况的相对指标,通常用百分数(%)表示。
四、计算题
1、某市1979年调查20岁男学生160人的脉搏数(次/min),已知资料服从正态分布,并求得均数为76.1,标准差为9.32,估计该市20岁男学生脉搏数的95%可信区间?
2、10人某病潜伏期(天)分别为4,3,6,5,4,7,6,11,9,7,求中位数。 答案:3 4 4 5 5 5 7 7 9 11 中位数是5
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。