贝叶斯估计对比于经典估计的优势分析与其局限性
贝叶斯估计对比于经典估计的优势分析与其局限性
经典估计和贝叶斯估计
经典估计理论是通过一个随机抽样过程,从总体中随机抽取一定数量的样本,再结合总体分布或总体分布族提供的的信息,推断出总体分布或总体特征,在整个推断过程中,使用到了总体信息和样本信息。
贝叶斯估计在推断总体的过程中,不仅使用到了总体信息和样本信息,还须要使用先验信息。贝叶斯学派认为,通过历史资料和经验总结出先验信息,可以使统计推断更为精确。
经典估计的局限性
经典估计理论包括两种形式的估计,即点估计与区间估计。
点估计就是将估计值表示成一个数值,通过验证其是否具有充分性、无偏性、一致性和有效性来判断估计的精确程度。在估计的过程中,通常需要的是充分统计量,它包含了所有有关参数的信息,而在实际研究中,我们如果像做题目一样假设我们抽样的统计量就是充分统计量,就显得太过于主观。用于衡量有效性的是估计量关于参数值的方差,方差越小,有效性越高,但是在抽样调查中,我们都知道样本容量越大的样本统计量的方差越小,这使得有效性的标准在某种程度上失效。
区间估计相较于点估计具有更高的精确度,通过明确样本的误差,做出更可靠的估计,只要参数落在在估计区间的概率能被人们接受就足够,这种概率被称为置信水平。但是置信水平是人们主观确立的,不同的置信水平得出的置信区间就不一样,而且存在一定的重叠,估计区间中也包含了错误值,使得基于频率主义区间估计也具有一定的局限性。
经典估计局限性还包括将先验信息排除在外,这不符合科学推理原则,因为我们在进行估计的时候往往是在特定的背景下进行,就像《数理统计》贝叶斯估计中例1说的那样,工厂的生产是具有连续性的,在估计当天的产品合格率时,除了进行抽样检测,也需要联系过去一段时间该产品的合格率,从而做出更合理的估计。例如通过查询得知过去一段时间的产品合格率为0.95,而在今天的抽样中得出产品的合格率为0.8,如果简单地认为今天产品的合格率为0.8,显然不能让人接受。
贝叶斯估计的优势
相较于经典估计的频率主义,贝叶斯估计坚持主观主义的概率解释,它的估计必须依赖于先验概率的分布,而先验分布是试验者对于在进行试验之前得到的资料的主观意见,虽然这种主观意见与科学的客观性存在一定的矛盾,但是在一定程度上弥补了经典估计不能应用于不可重复独立事件的概率问题。例如,如果要估计在一场比赛中甲乙双方的胜率,双方世界排名相当,采用经典估计的方法,认为两个人胜利的概率分别为0.5,但是利用贝叶斯估计,查询两个人比赛的历史记录,发现在近5场比赛中甲方赢了四场,则可以估计甲获胜的概率应该更大。
贝叶斯估计需要利用到似然原则,而就像上课提到的那个问题一样,抛12次硬币有3次正面朝上的二项分布和抛硬币得到3次正面向上的试验次数为12的负二项分布的似然函数是相似的,似然函数与试验的设计没有关系。贝叶斯估
计通过利用先验信息,结合似然原则,可以弥补经典估计抽样选取充分统计量的主观性不足,协调了样本的随机性与充分性。
贝叶斯估计的局限性
就像前面反复提到的贝叶斯估计的先验分布确定的主观性,由于不同的人对于先验信息的理解不一样,得出的先验分布也不尽相同,从而得出的后验分布也存在一定的差异,这与科学的客观性相矛盾。而且贝叶斯估计的原理就是利用旧资料进行更精确的估计,但是很多科学家质疑旧资料是否能够支持假说,由于自身知识有限,无法做出更深入的解释。
贝叶斯估计的应用
尽管贝叶斯估计存在一定的局限性,但是在实际生活中有一定的应用,在某些实际问题中,研究往往能够通过先验信息做出更合理的估计模型。例如在房屋震害预测中,以地震考察取得房屋破坏资料为基础,做出贝叶斯模型。还有在经济学问题中,例如车险保费的确立,可能因为缺乏对于投保人的了解,产生信息不对称问题,而无法合理确立保费,使得保险公司受到损失。但是如果我们通过事前调查,了解投保人的事故率,从而确立更准确的保费。再拿更生活的实际例子来说,为了预测08年奥运会的开幕式当天是否会下雨,研究人员不仅分析了当天的云层情况,还结合了历史年份该日的天气情况的先验信息。
就我自己的实际生活来说,在高考填报志愿的时候,如果不利用先验信息,我只能通过对比自己的省内排名,学校排名和在本省的招生人数填报志愿,但是实际上由于专业热门程度会影响学校的填报,更为重要的是对比历年的该学校在省内招生的学生排名做出选择。
总之,由于贝叶斯估计对于先验信息的考察,再结合似然原理,在某些极端的情况下,比经典估计更具有优势,关键在于先验信息是否具有考察意义和如何确立最优先验分布。