几种实验设计方法的比较
几种实验设计方法的比较
*刘红波,陆刚,边宽江
(西北农林科技大学理学院,陕西杨凌712100)
摘要 实验方案的设计与选择对于实验人员来说起着至关重要的作用,分析比较了常用的正交设计、均匀设计、球面对称设计、二次回归通用旋转设计等方法的适用范围及优劣,以供实验人员选择适合自身实验的最优方案。关键词 正交设计;均匀设计;球面对称设计;二次回归通用旋转设计
中图分类号 S11 文献标识码 A 文章编号 0517-6611(2007)36-11738-02
ComparisonAmongSeveralMethodsofExperimentalDesignLIUHong-boetal (CollegeofScience,NorthwesternA&FUniversity,Yangling,Shaanxi712100)Abstract Thedesignandchoiceofexperimentalschemeareveryimportantforthelabassistantsanditispuzzledfortheirtoselectthebetterexperimen-talscheme.TheusualmethodwasdescribedandwascomparedintherangeofapplicationwithOrthogonalDesign,UniformDesign,SphericalSymmetricDesign,Second-orderGeneralizedRotationDesign,whichcanhelpthemtoselectappropriatemethods.Keywords OrthogonalDesign;UniformDesign;SphericalSymmetricDesign;Second-orderGeneralizedRotationDesign
实验设计(DesignofExperiments)是研究如何制定适当实验方案以便对实验数据进行有效统计分析的数学理论与方法。通常所说的实验设计是以概率论、数理统计和线性代数等为理论基础,科学地安排实验方案,正确地分析实验结果,尽快地获得最优化方案的一种数学方法。实验通常要选择一种或几种实验设计方案,实验设计的方法各有其适用范围和优缺点,实验者应根据实际需求进行适当选择。1 几种常用的实验设计方法
1.1 正交实验设计 正交实验设计(OrthogonalDesignExperi-mentation)是以概率论数理统计知识和实践经验为基础,利用标准化正交表安排实验方案,并对结果进行计算分析,最终迅速找到优化方案的一种科学计算方法。它是处理多因素优化问题的有效方法,正交表是正交设计的基本工具,具均匀分散性和整齐可比性。其特点:①有一套表格,便于多因素实验的设计与数据分析;②由于有正交性,易于分析出每个因素的主效应;③数据点分布均匀且具有整齐可比性,因此可应用方差分析对实验数据进行分析。经过对实验结果进行分析,能清楚各个因素对实验指标的影响程度,确定因素的主次顺序,找出较好的实验条件或最优参数组合。1.2 均匀实验设计 均匀实验设计(UniformDesignExperi-mentation)的基本思想是抛开正交设计中“整齐可比”性的特点而只考虑实验点的“均匀分散”性,即让实验点在所考察的范围内尽量均匀地分布。由于不再考虑“整齐可比”性,那些在正交设计中为整齐可比而设置的实验点可不再考虑,因而可大大减少实验次数,且实验次数与各因素所取的水平数相等。用均匀设计可适当增加实验的水平数而不必担心导致像正交设计那样其实验次数呈平方次增长的现象。其特点就是除了有一套简易的表格外,它能以最少的实验次数、最短的实验周期得到一个回归方程,该方程能定量地描述各因素对目标函数的影响,得到最佳工艺条件。
1.3 球面对称实验设计 球面对称实验设计(SphericalSym-metricDesignExperimentation)是考虑到任一因素对指标的影响作用均有一定范围,将这些范围以一定的代码予以统一,
作者简介 刘红波(1982-),男,陕西乾县人,硕士研究生,研究方向:
应用数学。*通讯作者,硕士生导师,副教授。
收稿日期 2007-07-31
从而只要在这些范围内考虑它们的作用和影响。球面对称设计就是在一个球面上确定实验点的设计,实验点分布在球面各卦限内的中心点和球面与坐标轴的交点上,而球心作为中心对照点。实验所考察的因素个数为空间维数,因素个数的平方根为球半径,各实验点的坐标就是对应因素的水平。这样,实验点的坐标有-r、-1、0、1、r5个,即各因素有5个水平,故球面对称设计是5水平的实验设计。
球面对称设计的实验次数为2l+2l+1(其中l为因素个数),这里5个水平的安排是以任2个水平间差的比值与对应坐标差的比值相等为原则。取3因素为例:l=3,r=3,若安排某一因素的水平,水平应在1∶10,故该因素的水平代码在-3∶3之间。
x的计算是(1-x)/[(-3)-(-1)]=(10-x)/[3-(-1)],从而得到x=2.902,即该因素的第二水平是2.902,依次可求y=5.6,z=8.098.同样,求出第二、三个因素的水平值,设计就此完成。球面对称设计的目的是寻求考察的指标同所选的因素某种相关关系,将这种关系以函数形式表达出来,其特点为:实验次数较少、精度较高,并且由此得到的关系式可确定任何在范围内的实验点的预测值。对于需要控制指标的实验,效果尤为显著,但缺点是设计较复杂,必须有丰富的专业知识来确定各因素的范围,所以要求较高。1.4 二次通用旋转实验设计 凡与实验中心点距离相等的球面上各点回归方程预测值的方差是相等的回归实验设计,称为旋转设计(RotationDesign)。二次通用旋转实验设计(Second-orderGeneralizedRotationDesignExperimentation)能使回归预测值^y的方差是在球心为原点,半径为r的球内的一个常数。该设计的一致精度和需要实验次数较少等优点广泛应用于科学实验中。
二次通用旋转实验设计是通过组合设计来实现的,它的n个实验点由三类实验点组合而成:n=mc+mr+m0=mc+2f+m0,其中f为因素个数,mc个实验点分布在规范变量(z)空间中半径为rc=f的球面上,mr=2f个实验点分布在半径rr=r的球面上,m0个点集中在r0=0的球面上(即原点)。组合中用mc,r,m0的互相调整来满足设计要求。①用mc确定r,满足旋转性要求。r=4
mc。②使用适当的
m0,使设计具有一定的正交性,由于mc,f,r都已确定,为了
保证二次回归系数bjj间的正交性,m0必须满足n(mf+2r4)
(f+2)(m2
=1,由此得二次通用旋转实验设计的参c+2r)^2数(表1)。
表1二次通用旋转实验设计参数fmc
mr
rnm02 4
4
1.41413 5
3861.[1**********].000317 二次通用旋转设计的最大特点是克服了二次回归的预测值的方差强烈地依赖于实验点在因子空间中的位置这个缺点,由于实验误差的干扰,就不易由预测值直接寻找最优区域。而采用回归旋转设计实验方法,使得在与实验中心点距离相等的点上,也就是分布在同一球面上实验组合的预测值具有相同的方差,这样可使实验次数大大缩减,工作量大为减轻,再借助于计算机统计分析,模拟寻优,即可找出多因素的最佳组合及变化趋势。2 实验设计方法的评价与比较
2.1 评价标准 评价一种实验设计方法的优劣主要从两个方面考虑:该方法的精度和对实验数据的处理。我们选取某种设计方法,首先要看它的精度,即运用该方法得到的结论是否与实际相吻合。这就牵扯到了实验的次数,经验表明,样本容量越大,得到的估计值越可靠。而上面几种设计方法的实验次数不尽相同,正如均匀设计,所需实验次数较少,自然精度也就不是很高。但对于一些比较昂贵的实验来说,实验人员需要节省大量的人力、物力和财力,他们会相对选取一种实验次数较少的方法。
除此之外,选取了合适的设计方法后,如果对实验数据处理不当,依然很难得到预期的目的。因为,每种设计方法都要选取一种较优的数据处理,而常用的实验设计方法都有相应的一种或几种数据处理方法,实验者应该根据自身实验的特点择优选择。
2.2 几种实验设计方法的比较 由表2可知,正交设计是一种直观的方法,它所需的实验次数为l2
,即为因素水平的平方。它对实验数据的分析也是采用直观分析法(方差分析),即只需分析各水平的极差,极差最大者为最优,但它只能确定哪个因素为主要因素,而因素对指标的影响有多大是不能控制的。
对一些多因素多水平的工艺过程进行考察时,用正交实验需要较多的实验次数,而用均匀设计只需做与水平数相同
的实验次数,这样大大减少了实验的人力、物力和财力,尤其是对一些比较昂贵的实验。然而,由于均匀设计的实验次数较少,因此它的实验精度也就不够。均匀设计舍弃了整齐可比性,因此,对所得实验数据的处理不能用方差分析,应采用多元回归分析或逐步回归分析的方法,建立一个定量的回归模型。回归分析中可对模型中因素进行回归显著性检验,根据因素偏回归平方和的大小确定该因素对回归的重要性,这样也就优化出了主要因素及最佳工艺条件。
表2四种设计方法比较
实验方法
实验次数数据分析适用范围正交设计
l2
方差分析
多因素多水平实验均匀设计
l
多元回归分析或多因素多水平实验逐步回归分析
球面对称设计2f+2f+1多元回归分析多因素五水平实验二次通用旋转mc+2f+m0多元回归分析多因素五水平实验
设计
而球面对称设计的实验次数与正交相当,为2f+2f+1,f为因素个数,但它的实验精度要比正交实验精度高,并且由此得到的关系式可以确定任何范围内的实验点的预测值,对于需要控制指标的或多指标的实验,效果尤为显著,它对数据的处理也是采用多元回归的方法。
由于二次通用旋转设计是一个组合设计,它所需的实验次数为n=mc+mr+m0=mc+2f+m0,在二次通用旋转设计中,依旧采用多元回归分析,但由于回归系数之间的相关性没有完全消除,因此,回归系数的计算、方差分析及显著性检验就不同于其他设计,也不便于直接在表上进行,这也是实验者需要注意的地方。3 结论
实验设计优化法必须完成两方面的工作:正确描述结果或指标与各考察因素的关系,即建立合适的数学模拟方程,依据数学方程选取较佳工艺,建立准确的数学模型是解决问题的关键,除了要求实验者尽量准确地控制实验条件之外,还需选择合适的数学模型。以前多采用线性模型,但大多数情况下,各因素对结果的影响并非线性,选用二项式或更高次多项式往往会得到较好的效果。参考文献
[1]邓勃.实验设计与优化方法[J].分析科学学报,1996,12(2):157-162.[2]卢恩双,宋世德,郭满才.回归通用旋转设计的几个问题[J].西北农林
科技大学学报:自然科学版,2002(5):110-112.
[3]李新国,续九如.林木田间实验适宜重复数和小区株数的研究[J].北
京林业大学学报,1993,l5(4):103-111.[4]袁志发,周静芋.实验设计与分析[M].北京:高等教育出版社,2000.[5]刘光祖.概率论与应用数理统计[M].北京:高等教育出版社,2000.