点估计与飞镖游戏
统计故事:点估计与飞镖游戏
飞镖游戏起源于英国,是一项风靡全球,集趣味性、竞技性于一体的休闲运动项目,既可用于比赛,又可作为工作、学习之余的消遣。从统计学的角度看,飞镖游戏暗含了点估计的统计推断思维逻辑,可以用来直观说明点估计的原理。简单起见,假定4位选手(A、B、C、
D)参加飞镖比赛。前3位选手的比赛成绩如图1所示,第4 位选手的比赛结果单独列出,如图2所示。其中,小点表示各位选手投掷飞镖的结果,飞镖盘中心的白点表示靶心。
那么这些密密麻麻的小点和点估计又是怎么扯上关系呢?实际上,只要是估计,总要有一个估计目标,通俗地讲,估计就是猜测,总有一个可能被猜中的“正确”答案。若以总体均值作为目标,该目标或“正确”答案就在图1、图2飞镖盘中的靶心的位置。各位选手的每一次投掷(其结果就表现为小点),可以看成是估计或猜测的一次尝试,统计学人称为估计量(其结果称为估计值)。猜测总有准或不准的问题,我们还需要游戏评委对比赛结果作进一步地解说。
在飞镖游戏中,我们不能只看一次投掷结果,更重要的是透过多次投掷结果去分析评判一位选手的竞技素质。要反映一位选手的竞技素质,至少可以从两个方面着眼:①眼神好坏:是否能盯准靶心;②投掷技术稳定性:手发抖的程度。游戏评委按照这两个标准,对
4位选
手竞技素质作了评判:选手A的投掷结果紧密围绕靶心,可以断定其眼神好使,手不抖。选手B的投掷结果密集在飞镖盘的左下角,说明该选手手虽不抖,但严重斜视,你不能说该选手技术不稳定,但由于眼神问题,不能很好瞄准靶心。选手C投掷结果非常密集,却略微偏离靶心.说明该选手技术相当稳定,遗憾的是略带散光。至于选手D,和飞镖靶有仇似的,将整个飞镖盘打成了麻子。他眼神没有问题,能够盯准靶心,但手却抖动厉害。这样来看,A为专业选手,而B、C、D由于各种原因,只能是业余水平了。
统计学中一个估计的好坏,实际上也是这个评判逻辑。
首先,单次的估计值不足以决定一个估计的好坏。拿上面的飞镖比赛来讲,再稳定的选手也有踩西瓜皮的时候,比如选手A也可能阴错阳差投出脱靶的飞镖来,虽然这种可能性并不大。而选手B也可能投出正中靶心的结果,那是他歪打正着。
其次,估计的好坏,正如一个选手的竞技素质。投掷技术稳定性,即手的发抖程度,对应估计量的方差。而眼神好坏,即是否能盯准靶心,对应估计量的偏差。所有眼神好使选手的投掷(这里为A和D),在统计上,对应无偏估计。若在眼神好使的选手里面论英雄,则手不抖者胜,显然选手A毫无争议摘得桂冠,这在统计上对应为有效估计。至于选手B和C,由于眼神问题,在这样的标准下,连排名的资格都没有。
如此一来,选手C必然会喊冤,他觉得自己的投掷结果离靶心很近,不能单以眼神定成败。游戏评委考虑到专业选手并不多见,在业余选手中也需要定个标准来决定名次。因此,将眼神好坏和投掷技术稳定性综合起来考虑,给出的结果是选手C强于D。这在统计上便对应于著名的均方误差准则及其分解问题了。
事实上,统计学许多分支,如抽样调查理论(仅就准确性而言)、回归分析理论(包扩参数和非参数)等,在参数估计中的主要思维逻辑仅此游戏而已。而广大统计学人,便是游戏评委。
作者:黄恒君
摘自:《游戏中的统计推断逻辑:点估计》