多目标决策问题的博弈论方法初探
第12卷第6期
2003年12月运筹与管理VO【12.Nu61)ec.2003OPERATIONSRESEARCHANDMANAGEMENJl∞IENCE
多目标决策问题的博弈论方法初探
董雨1,胡兴祥2,陈景雄1
(1.巾囤科学技术大学,安徽台肥230026:2合肥工业大学团委.安徽合肥230009)
摘要:本文通过对多目标决策中常用解法的改进,提出了运用博弈论的方法求解多目标评价的思想,讨论了相
互冲突的目标决策和非合作博弈问题中的三种类型,并给出了相应的求解路径。
美蕾词:多目标决策;博弈论Nasll;均衡解
中围分类号:0221.60225文章标识码:A文章编号:1007—322112003)1)6.0035.05
GameTheoryAnalysisOnMulti’。ObjectiveDecision
DONGYul,HUXing—xian92,CHENJing—xion91
(1.UniversityolScienceandTechnologyolC油ina,BusinessSchool,HF扣I230026,(Mjn“
2.HefeiU,『liversity吖Technology,HeJPl230009,China)
Abstract:Inthisarticle,weimprovethecommonmethodsforthemulti—objectivedecision,andtrydueethegametheory
nOB—cooperatetOtOintro—thisfieldWealsodiscussthreetypesofthemulti—objectivedecisionOilcompete&problem,andthecorrespondingsolutionisgiven.
Keywords:multi—objectivedecision;gametheory;Nashequilibrium
0引言
近年来,人们日益认识到,在分析和解决某些经济问题时,必须同时考虑多个目标。常用于求解多目标决策的方法比较多.如平方加权和法,∈一约束法,等,这些解法在本质上都归结于多目标的线性组台。由于这些解法都是从某一个方面揭示多目标决策问题,因此就存在着需要改进的地方。
决策人面对多个目标进行决策时,这些目标一般是冲突的。为了调和这些冲突,它要以某种方式解决目标之间的矛盾。本质上,博弈论是研究解决、调和冲突的科学,根据博弈论思想,如果我们将决策者设置为局外人.把各个目标作为局中人,而各目标在某一方案下的值即可与博弈论中在一个条件下的局中人支付作对应。这里的目标方案则是博弈论中的策略。一旦目标条件确定,则策略也随之确定,同时也产生了相应的支付。通过博弈选择,我们可以得到对应多目标决策问题的博弈解,而决策者这个局外人要做的是根据自己的偏好与效用情况,从博弈解中选取满意解。由此可以把多目标决策问题与博弈论问题从本质思想上联系到一起…。
1多目标决策的博弈观
大多数而言,多目标决策具有相互冲突性,各个目标之间是对抗的.引用博弈论的语言.就是非合作的收藕日期:2003.03一U6
基金项目:田牢863计划赞助项目(20‘d2AA41361)作奢简介:量雨(1968.j,男,安擞阜阳人,中回科学技术走学博士研究生.研究方向曲知诅管理、信息蛀济学、博彝诗.
运筹与管理2003年第L2卷
(1iOn~coorporation)。我们通过引入博弈论思想,从三个方面分析相互冲突的目标决策与非合作博弈多月标决策问题的最优决策准则.这具有一定代表性,也是运用博弈解法的基础。
首先把各目标放于完全竞争(冲突)的环境中来考虑,每~目标都争取达到最优值,这样我们得到完全竞争下的非合作平衡解,然后考虑整体利益最优,把目标看作是存在相互合作的,并在合作中得到大于各自独立行动时利益的整体,最后考虑如果目标存在层次性的情况下,如何求得两者的博奔最优解。
2有限方案的两目标决策与二人零和、一般和有限博弈
因为实际管理行动中的可行方案是有限的,所以有限方案的两目标决策可以用矩阵形式列出,并标出在这一方案下,两目标所赋予的对应值。如表1所示:
表l有限方案商目标决策的决策矩阵
届
方案
xl
x1性F2(t)F2I【xFI(j)—l(xIj2)^l(x1)F22(x2)
其中X.∈盘”为欧式空间的一个向量,F州(x。.)和F们(x。)为各自属性下的数值。
实际问题中,由于F。(z)和F:(z)方案的属性性质不同,为了统一量纲,我们首先需要将属性值加以规范化‘“。为了把两个央策目标作为两个博奔局中人分开处理,我们构造以下两个归一化后的矩阵:
^(z1)
(I一1)
/l(上。)B=(1—2)
这里/i(z,),/j(zi)∈[0,1J.(j=1,2,A.州)
由此我们可以把有限方案两目标决策转化为二人一般和矩阵博弈,即,=(x,y,A,B),其中x,y分别表示两目标采用某一策略z,.A,B分别表示两目标的支付。因为以n维向量来表示两目标的策略.所以此处A,B是斜对角矩阵。如果把n维向量分成两个变量,即z=[¨”J,“,w的维数之和为¨即Rank(H)+R洲点(v)=Rank(工),则支付矩阵A,B可表示为:
A=(1—4)为了方便,也可写成为双矩阵支付形式
C(1—5)
对于(11),(1—2)的策略来说,我们可以这样认为,两个目标局中人的策略是相巨约束的,而对于(1—3)和(1—4)我们将可以由f,(z)能控制的向量分量分离到“中,而把止(。)能控制的变量分离到w中,这样“和。就是-厂。(z)和儿(z)的独立策略而不依赖于对方了。我们先针对非合作博弈的情况来解这类问题,此时两目标决策问题可以有4种类型的解。
(”收益影子值最大双方都希望自己的收益越大越好。记
第6期董雨,等:多目标决策问题的博彝论方法初探
f岛=s“P/I(“,∥)、“。Jt’37J
l卢2=s“巳,2(“,u)
称为博弈的“影子最大”。若恰好存在(i,;)∈a同时使岛+口:成立,那么(i,;)为最优解,同时也廿J求得目标问题的最优解。
(2)保守解
两目标都猜测博弈对方要尽量使自己的收益最小,所以都没有想在最坏的情况下能得到最好的收益,因此这种目标方案存在保守解,对于(“,”)有:
f/1*(“‘,F。)=supfl(H,口。)=supin驴j(“U)
』““”
【,?(“。,。‘)=supf2(“’,u)=supin叽(“,口)
(“’,u’)即为两目标决策的保守解。
(3)非合作平衡解(Nash解)
若有博弈策略对(i5)满足:
f/l(H'u)=StlⅣ1(“,u日)
≮“
一一
I/z(ff,F)=su∥2(“,口)
则(i,;)为非合作平衡解。这时(i,;)为双支付矩阵的鞍点(SaddleI,oi。t)‘¨,其意义是:在平衡点时.任何一方若单独改变策略的话,都会使自己的收益降低。
(4)混合扩展的Nash解
不妨设局中人多次重复进行同一博弈活动,在每次博弈过程中,各自随机地选取策略。经多次进行之后,再计算局中人的平均收益,这时局中人甲可能以“。的概率选取策略一.a2的概率选取策略二.在多次决策过程中,甲以概率“=(“l'…一,n。.)作为策略,并称其为甲的“混合策略”。对于上例,我们得到混合扩展的Nash解:
若有策略对(二,i)∈x×x,使
{面i>oA_1五呖≥二B6V“∈x,V6∈x
则称(二,b)为两目标决策的一个非合作平衡点(Nash解),其意义与上面纯策略的情况相似,只是每一策略已赋予了概率的含义。
在一般情况下A+B≠O,这时适合用二人一般和博弈来解这类问题。但在特殊的情况下,也就是当A十B=O时,这时我们可以用二个零和博弈来解此类问题。
3无限方案的两目标决策与二人无限博弈
无限方案指的是决策目标方案的数目是无限的,其中隐含着,方案中至少有一个分量是无限的,简单的模型建立如下:
F(zl,。2)=max(Jl(工1,上!),/2(92I,zz))
f(T,’{,)∈U
sL=<ucXl×X2
【一1∈义l,。2∈x2
其中u为解集可行域。值得注意的是,可行集并不一定等于x.×x2,而是给定上.∈x。,T2受约束于集合S(x2)={z:∈x2I(z1,z!)∈u},亦即一方目标的策略选择不仅影响了另一目标的利益,同H,I-也影响到彦的可行集。如图l所示”1:
与上述有限方案的解法类似,我们可以定义无限方案下两目标决策博弈问题的解。(I)目标方案收益影子值最大
运筹与菅理2003年第12巷
圈1可行集图示
』p一。。…su,是L,,t‘zt,2:’
lp,一。,翠/j(%。z’
若恰好存在同时使两者成立lIVe(;。,;2)为最优解。
(2)保守解
令
/(zl)=^(z现
趣J、l/
那么保守解为(z2)=r(z“邮甜“^
_m21一’s蝉“(X1)
1wl=s她尼(zz)
这一解可作为博弈规则中的“威胁”值,即因为博弈中的一方认识到无论如何,他至少都可以得到。‘t或口§的收益,所以定义
V=l(z。,z2)∈uI/(z.,.T2)≥vcI作为优势解。因为博弈双方都把保守解看作为解的底线,在获取更大收益的驱动行动下,保守解是极不稳定的。
(3)Nash非台作解
如果两目标方案
ffl(“X2)-m啦a∥xf(mz2)
【,j(至1,;2)=“p芋/2(王l,卫2)
同时成立.则(三.,;:)称为无限方案的两目标决策的Nash解,意义同上述的有限方案中所述。因为局中人的博弈双方已经获得了Nash意义上的均衡,所以这一解有对于双方来说都具有个体的稳定性‘“。
对于Nash非合作解,定义(;l,;2)∈X一。(;2)X又2(;】),其中
f贾,(zz)=;;,∈x・l,-(j一,5F2)5。m.。a。x.ft(z・,X2){
【贾2(z1)={;2∈x2lf2(xl,322)=maxf2(xI,x2)}
分别称为两目标的理性集,则在这种解集众博弈双方都获得了最优。
(4)扩展的Nash解
针对Nash非合作解,如果我们以连续分布的密度函数代替有限方案的概率选择,这时有
E^(F,_)b”
G州d№b、Ab
第6期董雨,等:多目标决策f-q题的博彝论方法初探39其中,F(z),G(z)分别表示两个目标在方案集全体上的概率累计函数。
定义无限方案混合情况的Nash解,当
E(F,G)=nlsxI邶E^(F.y)dG(y)
一一门VG(_)』
、】E(F,G)=IxlaxIEB(z,G)dG(z)VF(z)JU
同时成立.我们称F(z),G(Y)为决策的博弈中无限方案的混合扩展解。
由上分析,对于无限方案的两目标决策与两人无限博弈问题的解具有一定关联性。
4多目标决策与,z人博弈
实际应用中,若把以上的两目标决策推广到n个目标,相应的也可以把其对应的博弈模型推广到”人博弈的情况中:
infixl厂l(工),…,^(_)I—r(~,{x2l,{P,})
Nash平衡点的定义与前面两目标类似,即
z=(zl,.一,z。)称为Nash平衡点,如果对每个目标i,有
^(z)=r呻填(zIY。)
,,t,.
其中zlM=(z∥一,z,一l,Y,,置+l'一,z。)表示在局势z之下,目标i偏离z.而采用y.,其他目标策略不变的新局势。
同样,混合策略的Nash与两目标定义相类似。混合策略Nash平衡点同样可以用Lemeke—HowNon【61算法来算出。
5结论
总之,运用博弈论方法解决多目标决策是一种尝试,我们首先分析的是在竞争条件下相互冲突的目标决策与非合作博弈问题,并试图得出一些结论。对于博弈论求解多目标决策,在合作和控制方面,还有追求整体最优目标决策与合作博弈、层次性多目标决策与Stackelberg博弈等方法,这需要我们进一步加以努力探索。
参考文献
[I]和蔚博奔论及H应用贵州师范大学学报[J]+1998(2】:16-20
【2JKasprzakEM.LewisKEParetoAna[ysisinMulti—objectiveOptimization
22,lsaue3,2001:208—218UsingtheColinearityTheoremScalingMethod[J]StructuralandMultidisciplinaryOptimizafion,Volume
[3]n鼍洪,周心权一种综合决策指标属性值规一盘化技木新途径[J]系统工程学报,2000(2):25.28
[4]t运筹学)教材编写纰运筹学第2版[M].清华大学出版社,1990
[5]张浆迎博弈沧与信息经济学[M]上海三联出版社1996年第1版,P
【6JBalinskiML,CotdeRWComplemenlarityandFixedPoint68PuNishingCompan,:1978Problems[M]North—Holland
多目标决策问题的博弈论方法初探
作者:
作者单位:
刊名:
英文刊名:
年,卷(期):
被引用次数:董雨, 胡兴祥, 陈景雄董雨,陈景雄(中国科学技术大学,安徽,合肥,230026), 胡兴祥(合肥工业大学,团委,安徽,合肥,230009)运筹与管理OPERATIONS RESEARCH AND MANAGEMENT SCIENCE2003,12(6)10次
参考文献(6条)
1. Balinski M L;Cottle R W Complementarity and Fixed Point Problems 1978
2. 张维迎 博弈论与信息经济学 1996
3. 教材编写组 运筹学 1990
4. 冯圣洪;周心权 一种综合决策指标属性值规一量化技术新途径[期刊论文]-系统工程学报 2000(02)
5. Kasprzak E M;Lewis K E Pareto Analysis in Multi- objective Optinization Using the ColinearityTheorem Scaling Method[外文期刊] 2001
6. 和蔚 博弈论及其应用 1998(02)
引证文献(11条)
1. 苗强. 张学友. 毛军军 基于模糊语言判断矩阵的多目标博弈研究[期刊论文]-合肥师范学院学报 2010(3)
2. 杨二波. 陈明 船舶主尺度方案的博弈优选[期刊论文]-中国舰船研究 2010(6)
3. 郑丞. 金隼. 来新民. 李余民 基于非合作博弈的公差分配优化[期刊论文]-机械工程学报 2009(10)
4. 谢能刚. 方浩. 包家汉. 赵雷 具有目标偏好的多目标博弈设计与机构仿真[期刊论文]-系统仿真学报 2007(1)
5. 袁倩倩. 蒋鹏. 黄世旺 快速城市化地区公交线路优选应用研究[期刊论文]-山西建筑 2006(6)
6. 潘创业. 谢能刚. 包家汉 多目标并行博弈算法的研究与应用[期刊论文]-机械传动 2006(2)
7. 谢能刚. 孙林松. 郭兴文 博弈分析方法在重力坝多目标设计中的应用[期刊论文]-河海大学学报(自然科学版)2006(2)
8. 韩莉 上海合作组织框架下中俄关系的博弈研究[学位论文]硕士 2006
9. 谢能刚. 方浩. 包家汉. 赵雷 博弈决策分析在补偿滑轮组变幅机构多目标设计中的应用[期刊论文]-机械强度2005(2)
10. 包家汉. 裴令明. 谢能刚. 张玉华 机构多目标优化与博弈决策设计[期刊论文]-安徽工业大学学报(自然科学版) 2005(2)
11. 杨二波. 陈明 船舶主尺度方案的博弈优选[期刊论文]-中国舰船研究 2010(6)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_ycygl200306008.aspx