留一交互验证法RMSECV 预测误差均方根 RMSEP
RMSECV=sqrt(sum((Y-Yv).^2)/n);
其中Y是真实值,Yv是交互验证时的预测值;
留一交互验证法
就是:每次从样本集中取出一个样本,用余下的样本来建立模型,用建好的模型来预测之前取出在这个样本,直到样本集中每个样本都被取出过一次。
(用数学方法表达,设样本集中有n个样本,设每次从样本中取出一个样本(第i个样本,i =1,...,n),用余下的n-1个样本构建模型,用建好的模型去预测被取出的那个样本(第i个样本,i =1,...,n),得到样本的真实值和预测值,重复这个过程直到i从1递增到n,得到各个样本的验证预测值)这时就可以用上面的公式RMSEV=sqrt(sum((Y-Yv).^2)/n)来计算留一法交互验证的均方根误差。
RMSEP定义如下:RMSEP= ni=1(i-yi)2n(6)其中i为yi的预测值。方根误差亦称标准误差,其定义为 ,i=1,2,3,…n。在有限测量次数中,均方根误差常用下式表示:√[∑di^2/n]=Re,式中:n为测量次数;di为一组测量值与真值的偏差。
释义
均方根误差
root-mean-square error, 均方根误差亦称标准误差,其定义为 ,i=1,2,3,…n。在有限测量次数中,均方根误差常用下式表示:√[∑di^2/n]=Re,式中:n为测量次数;di为一组测量值与真值的偏差。如果误差统计分布是正态分布,那么随机误差落在土σ以内的概率为68%。 有人经常混用均方根误差(RMSE)与标准差(Standard Deviation),实际上二者并不是一回事。
均方根误差又叫标准误差
它是观测值与真值偏差的平方和观测次数n比值的平方根,
在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替.
标准误差 对一组测量中的特大或特小误差反映非常敏感,所以,标准误差能够很好地反映出测量的精密度。这正是标准误差在工程测量中广泛被采用的原因。
因此,标准差是用来衡量一组数自身的离散程度,而均方根误差是用来衡量观测值同真值之间的偏差,它们的研究对象和研究目的不同,但是计算过程类似。
举例
比如两组样本:
第一组有以下三个样本:3,4,5
第二组有一下三个样本:2,4,6
这两组的平均值都是4,但是第一组的三个数值相对更靠近平均值,也就是离散程度小,均方差就是表示这个的。
同样,方差、标准差(方差开根,因为单位不统一)都是表示数据的离散程度的。
若RMSEP≤RMSEE时,说明所建模型预测效果最佳。
预测误差
预测误差事物的预测值与其实际值之间的差异。它是评价预测准确度的一个重要因素。由于事物的发展变化受多种因素的影响,预测必有误差存在。 一般用于反映预测误差的综合指标有以下几个: ①平均绝对误差。指各期实际值与预测值的离差绝对值的算术平均数,即平均绝对误差 艺{y一y,{ MAD一乙望一一—一- 7Z式中,y,为t期的实际值,夕:为t期的预测值,t一1,2..·…n。 ②平均平方误差,即均方差( MSE),指各期预测误差的平方的算术平均数,即 材sE一工呈(,,一,,)“ 九r一1 ③平均平方根误差即误差的标准差(RMSE),指均方差的平方根,用公式表示: 尺对SE一丫五歹云云 计算预测误差的主要作用,是衡量预测方法的优劣,并在众多预测方法及预测模型中进行比较,以选出最佳的预测方案,提高预测的准确度。但是,不能简单地用预测值与将来的实际值之间的偏差来确定预测是否准确,因为产生偏差的原因多种多样:①事物的预测值是指如果不采取任何行动和实际措施将会产生的后果。当实际上采取了措施以后,实际值还会与预测值之间有偏差,这种偏差不能认为是预测的不准确。;雪由于预测值是一个平均数,一个期望值,将来的实际值会受到许多因素的影响,它会围绕预测值上下波动,这就会使预测值与实际值之间产生偏差③预测方法的不适当会产生预测误差。实际上预测误差主要是针对第1、第2种情况而言的。