体育统计学小炒
名词解释
1、体育统计学:是一门将概率论和数理统计的理论与方法应用于体育领域,为体育实践(体育教学、运动训练、体育管理和科学研究)提供解决问题的方法的工具学科。属方法论学科范畴。
2、指标:对于自然科学研究者来说,是在实验观察中用来指示(反映)研究对象中某些特征的可被研究者或仪器感知的一种现象标志。
3、系统误差:由于实验仪器、操作人员的操作水平、以及实验环境等因素产生的误差。 4、概率:随机事件A的频率
W(A)随着试验次数的变化而变
化,当n时,W(A)就越来越趋近于一个常数m, 则这个常数m 称为随机事件A的概率。记
为
p(A)
,即:
p(1nn
A)
W(A)i
(n→∞)
i1
5、机械抽样(系统、等距抽样): 预先给定一定的规则(当总体较大时),取一定数目的个体为一组,再从每一组中采用单纯随机抽样法抽取适当的个体组成样本。
6、分层抽样(类型抽样):当总体较大时,先根据总体的某些特征,将其分为若干类型(层次),然后从每一类型中采用适当地方法按一定的比例随机抽取适当个体组成样本。
7、整群抽样:当总体很大时,先将总体分为若干组,每一组被看作为总体的一个个体,再采用单纯随机抽样法抽取适当个体
组成样本。(此方法误差较大) 8统计量:由样本所得,关于样
本特征的统计指标
9体育统计学的研究对象及内容:体育领域内一些随机现象的数量规律,以及各现象间的相互关系
总体:根据统计研究的具体研究目的而确定的同质对象的全体称为总体。
集中位置量数:反应一群性质相同的观察值的平均水平或集中趋势的统计指标。
离中位置量数:描述一群性质相同的观察值的离散程度的统计指标。
变异系数:是反应变量离散程度的统计指标,它是以样本标准差与平均数的百分数来表示的,没有单位,记作CV。
相关分析:指用适当的统计量来描述两个变量或多个变量之间的相互关系,也就是定量显示变量之间的相关程度的方法。相关情况是多种的,故描述形式也是多种的,常用的是相关系数。 相关系数:就是两个变量之间相互关系的定量化描述,用符号r表示。(-1
回归:一个变量随着另一个变量而变化,它们之间的这种变化关系可以用方程式表示出来,继而可以通过自变量所规定的某一数值对因变量的数值做出推断或估计,这种推断式的求得,在统计学里称为回归。
回归分析法:由回归方程对两变量或多变量的数量关系进行分析的方法。
回归直线:用某直线的方程式近似的反应量变量的数量关系,即使个点到一条直线的纵向距离平方和最小,这条直线被认为最合适的直线,称之为回归直线。这条直线的方程叫直线回归方程。
填空、选择题
1.从性质上看,统计可分为两类:一类是描述性统计;一类是推断性统计。
2.体育统计的基本工作过程是:统计资料的收集、统计资料的整理、统计资料的分析。 3.位数、众数、平均数等。 4.离中位置量数的种类:全距、绝对差、平均差、方差和标准差。
全距:即极差,就是一组观察值中最大值与最小值之差。 绝对差:指所有样本观察值与其平均数的绝对差之和。 平均差:指样本中所有观测值与平均数绝对差距的平均数。 标准差:
5..根据正态分布的规定,可以证明,原始数据在[x-3S,x+3S]区间中所占数目可占所有原始数据的99.74%。
6.正态分布:X~N(μ,σ²) 标准正态分布:U~N(0,1²) 7.统计上所指的误差,泛指测得值与真值之差,以及样本与总体指标之差,常见有三种:随机误差、系统误差、抽样误差。 8.参数估计分为点估计与区间估计。
参数的点估计是选定一个适当的样本统计量作为参数的估计量,并计算出估计值。 参数的区间估计是指以变量的概率分布规律来确定未知参数值的可能范围的方法 1、 统计的分类:描述性统计和
推断性统计
2、 体育统计工作是一项复杂
的整体性的工作,其基本工作过程是:统计资料的搜集
——统计资料的整理——统计资料的分析
3、 体育统计研究对象的特征:
运动性特征、综合性特征、客观性特征
4、 概率的主要性质:1.概率P
为非负值,因m≧0,故任何随机事件的概率P≧0 2.当m = n时,P(A)=1,事件A为必然事件,当m =0时,P(A)=0,则事件A为不可能事件。3.若A、B两事件相互排斥,则P(A)+P(B)=P(A+B) 5、收集资料的基本要求:1.资料的准确性 2.资料的齐同性 3.资料的随机性
6、收集资料的方法:1.日常积累 2.全面普查 3.专题研究 7、资料的审核步骤:1.初审 2.逻辑检查 3.复核
8、常用的检验方法:1.t检验 2.u检验 3.x2检验
9、图凯法要求每组有相等的含量即所有的样本含量都相等;当各组被试样本含量不相等时,可采取S法检验进行两两比较。 10、线性相关系数的性质:相关系数没有单位,其值在-1与+1之间,∣r∣越接近1表明变量之间的直线关系越密切;∣r∣值越接近于0,则表明变量之间的线性关系越不密切。 11、标目是指横行和纵栏的名称,说明各项统计数字的含义。从表的内容上看,一切统计表都有它的主词和宾词两部分。主词通常用横标表示。
12、离中位置量数的种类:全距,绝对差、平均差、方差和标准差 13、求全距(R).
14、变异系数也是反映变量离散程度的统计指标,它是以样本标准差与平均数的百分数来表示
的,没有单位,记作CV:CV = (s/x)×100%
15、参数估计分为点估计与区间估计,置信概率或置信水平(1- a)常取95%或99%。
16、统计假设有两种类型:一是原假设(H0),该假设是肯定性假设,即假定所比较的样本统计量的总体参数相等;二是备选假设 简答
1、 体育统计在体育活动中的
作用:1.体育统计是教育科研活动的基础 2.体育统计有助于训练工作的科学化 3.体育统计能帮助研究者制定研究设计 4.体育统计能帮助研究者有效地获取文献资料
2、 动态数列的编制原则:1.时
间长短前后一致 2.总体范围应统一 3.计算方法应统一 4.指标内容要统一 3、 正态分布曲线的性质: 4、 假设检验的步骤:1.根据实
际情况建立“原假设”H0; 2.在检验假设的前提下,选择和计算统计量 3.根据实际情况确定显著水平a,一般取a =0.05或a =0.01并根据a查出相应的临界值;4.判断结果,将计算的统计量与相应的临界值比较,如果前者≧后者,概率P≦a,则差异显著,否定原假设,如果前者﹤后者,概率P﹥a,则差异不显著,接受原假设。
5、 方差分析的几个前提条件:
1.来自每个总体的样本都是随机样本 2.不同总体的样本是相互独立的 3.每个样本都是取自正态总体 4.每个总体的方差都
相等。
1.简述假设检验的步骤 ①根据实际情况建立“原假设”Ho;
②在检验假设的前提下,选择和计算统计量;
③根据实际情况确定显著水平α,一般取α=0.05或α=0.01,并根据α查出相应的临界值;
④判断结果,将计算的统计量与相应的临界值比较,如果前者≥后者,概率P≤α,则差异显著,否定原假设;如果前者α,则差异不显著,接受原假设。
2.方差分析的前提条件:
①来自每个总体的样本都是随机样本;
②不同总体的样本是相互独立的;
③每个样本都取自正态总体;
④每个总体的方差都相等 3.简述假设检验中的两类错误
第Ⅰ类错误,错否定,即“原假设”实际上是正确的饿,而检验结论是否定Ho,此时犯下“弃真”错误,统计上称为第Ⅰ类错误。
第Ⅱ类错误,错接受,即“原假设”实际上是不正确的,而结论却接受了Ho,此时犯了“取伪”错误,统计上称为第Ⅱ类错误。
4.常用的抽样方法有几种 简单随机抽样、分层抽样、整群抽样
12、一般正态曲线有如下性质:(1)、分布曲线位于X轴的上方,即f(x)>0。曲线是以直线
x为
对称轴,在x
与
x
之
间向上凸,其他部分向下凹,向左右两侧无限延伸,且离x轴越来越近,但永不与X轴相交。
(2)、分布曲线以与为正态参数。确定曲线的位置,确定曲线的形状。若相同而不同,则曲线的形状相同而位置不同;若相同,而不同,则曲线的位置相同而形状不同,越大曲线越偏平,说明离散程度越大,
(3)、X的取值范围是整个X轴,即区间(,)。 (4)、曲线与X轴之间的面积为1。随机变量x在区间[a,b]上取值y的f(概x)率等于曲线 、xa 、xb及x轴所围成的曲边梯形的面积。
6.简述在什么条件下必须对平均数进行多重比较
F检验是一种整体性的检验,当经方差分析鉴别多个正态总体的平均数有差异显著时,并不能说明各组水平之间都存在显著差异,只是说至少有一对差异显著,究竟哪些均数差异显著,哪些差异不显著,则还需进行均数的多重比较。当然,若F检验部显著时,则表明被检验的所有样本均数没有一对差异是显著地,此时无需进行均数的多重比较。
7.简述为什么要做相关系数的检验?(理解这段话,简述就行,不用这么多)P135
根据样本资料计算得到的相关系数与其他统计量一样,也存在着抽样误差的问题。如果在总体相关系数ρ=0(即,总体中不存在相关关系)的总体中随机抽样的话,由于存在抽样误差,也可能抽到r≠0的样本资料。因此,当以样本资料计算出相关系数r时,不能简单的根据r的大小对
随机变量X、Y间关系密切程度作出判断。r≠0有两种可能:一种情况确实在ρ=0的总体中抽取,此时r与ρ=0的偏差仅仅是由抽样误差所致;另一种情况确实不是在ρ=0总体中抽取的,而是在ρ≠0的总体中抽取出来的,此时r与ρ=0有着统计学中的显著差异。前者表明X与变量间没有线性相关关系,后者则表示X与Y变量有线性关系。由于这两种情况都可能存在,所以,当用样本资料所得到的相关系数r去推断总体是否相关时,必须对样本的相关系数进行显著性检验。 8.正态分布的特点
①曲线呈单峰型,在横轴上方,x=μ有最大值,称峰值。
②曲线关于直线x=μ左右对称,在区间(-∞,μ)上,f(x)单调上升,而在(μ,∞)区间上,f(x)单调下降,当x→±∞时,曲线以x轴为渐进线。
③变量x可在全横轴上(-∞
④因极大值为 ,故σ越大,极大值越小,峰值下降,曲线平缓,σ越小则结论相反。形象地说,σ的大小决定峰图呈“胖型”或“瘦型”。 1 事件包括: 随机事件 必然事件 不可能事件
2 概率的近似计算: P(A)=M/N 3 如何在实际问题中确定总体和样本?总体和样本的关系?如果提高代表性?
答:1 据概念(5名词解释) 2 包含,缩影,样本不完全等同于总体.样本对总体有一定代表性 3 a严格按照随机抽样的原则进行抽样 b 尽可能增大样本含量.样本数越多统计越准确
4 常用的抽样方法: 简单随机抽样 机械随机抽样 整群随机抽样 分层随机抽样
5 体育统计工作步骤: 收集---整理-----分析
6 样本统计量和统计参数之间的差异是由抽样误差造成的. 7 平均数标准差及变异系数在体育研究中有哪些意义?(区别)
答:样本平均数反映样本数据的整体水平,但是要结合标准差.标准差和变异系数反映样本数据的离散程度,对于运动成绩,表现为成绩的稳定性
8 相对数在体育中的意义?(区别)
答: 1可使原来不能直接相比的数量指标有可比性.2 是进行动态分析的重要依据
9 动态分析在体育研究的意义?(应用)
答:1 考察某些指标(如身体形态,素质等)发展变化的速度和规律 2 预测事物发展的水平 10 整台分布曲线的特点:1 为钟形曲线,在X轴上方 2 最高点在X=u处(u是总体标准差) 3
以
x=u为对称轴,两边逐渐接近X轴 4 随机变量X所有取值的概率之和为1.;即曲线下的面积为1. 5 总体的离散程度越大曲线越平缓.
11 标准差百分,累进积分法,百分位数发的用途和优点是什么? 答:1 标准百分用于正态分布及近似正态分布的资料上,能使不同计量单位的测量数据标准化,所以它适用于各种测量指标的比较和综合评价
2 累进积分法用于正态分布及近似正态分布的资料上,优点是运动水平越高,成绩上升
一个单位的难度就越大,因此相应的得分也就越多
3 百分位数法可用于任何分布状态的资料上,(以分数反间差异的大小和各组间个体差异的大小相近,即S间2/S内2≈1(无显著差异)
比较密切的直线相关关系后,期望着能够找到两个变量之间存在的数量关系,也就是找到一个 最恰当的数字表达式 ,用函数关
应某个运动成绩在集中的位置),优点通过位置,能了解某个成绩在集体中所处的位置,也能了解他的水平与集体水平的比较情况
12 假设检验的目的:区分差异是由抽样误差引起的.(差异没有本质的区别.样本来自同一个总体) 13 假设检验的基本原理:小概率事件 a=0.05显著水平 a=0.01非常显著水平
14 单侧检验与双侧检验:单侧检验只看差别不看方向.双侧不仅看差别还判断方向
15 u检验与t检验的实用条件:主要看样本含量n>30 u检验 n
16 t分布的特点:a 平均数位于中央曲线两侧关于y轴对称,曲线下总面积为1
b t分布的曲线随自由度(根据n得出)的变化而变化
c 当样本数n趋向于无穷大时,t分布曲线接近正态分布
17 标准正态分布曲线的特点: a 最高点在x=0处 b 以y轴为对称轴,两边逐渐接近x轴 c 其他特点都与正态分布曲线相同 18 因素:试验所要考查的对象 水平:因素在试验时所分的等级
19 方差的意义: 方差和标准差一样,是描述数据离散程度的统计指标.
20 方差的分析的基本思想(基本依据): a 如果u1 u2 u3之间没有差异,则三个样本之间的差异是抽样误差引起的,组内个体之
b 如果u1 u2 u3之间有差异,则组间个体差异要比组内个体差异大的多,即 u不=u2不=u3 ,即 S间2/S内2>1(显著差异) 21 变量之间的关系有两种,(函数关系和相关关系)有什么区别与联系?
答 区别:函数关系,对于某一变量的数值,都有另一个变量的确定值与之对应;相关关系,变量之间存在一定的关系,但不是确定的函数关系,变量之间这种有联系而又不确定的关系。 联系:即r=1或r=-1,当自变量x与因变量y的关系完全对应时,称为完全相关,也是指变量间有函数关系
22 什么是相关系数?相关系数的正负有什么意义?
答: 相关系数是描述变量之间关系密切程度的统计量,记做r 正: r=1 完全相关,函数关系 y=kx+b
负: r=-1 完全负相关 函数关系 y=kx+b
正相关,当变量x增加时,变量y相应增加 (0
23 相关系数的绝对值趋向于1 即|r|--1 说明两个变量之间关系越密切
相关系数的绝对值趋向于0 即|r|--0 说明两个变量之间关系越不密切
24 回归分析的目的:经过相关分析后,确认为两个变量之间具有
系来描述两个变量之间的关系,这就要借助回归分析的帮助 25 一元线性回归方程: y=a+bx(y为近似值)
26 相关分析和回归分析应注意的问题:a对变量进行相关和回归分析时要有实际意义b 先做相关分析,相关显著时再建立回归方程c y对x的回归方程与x对y的回归方程是不同回归方程,不能互推.d 相关分析与回归分析只适用于正态分布或近似正态分布的变量.
27 统计表和统计图有哪些类型,各种统计图有什么特点? 答: 有简单表 分组表 复合表
统计图 1散点图.将两变量的数据在坐标轴上描点构成,由散点表看出两变量大致的关系(考察两变量之间相关关系时用散点图)2 条形图:用宽度相同,长短不同的直条行描述,各类统计资料的对比关系(比较不同组大小时进行对比时用条形图)3 图形图:用圆的面积描述统计资料的总体内部结构情况4 线形图:以线条的升降来表示统计指标数值大小及变动趋势,可以反映一事物随另一事物的变化而变化的情况.5 直方图:根据A样本频数分布资料可以做出统计直方图,各条形之间设有间隔,通常以横轴表示组限,以纵轴表示频数(反映同一组资料的内部分布情况)