第九章_模糊聚类分析_181-202_
第三篇 评价、决策方法与模型
近年来,围绕着评价与决策方法,各种相关知识不断渗入,使得评价与决策的方法不断丰富,相关研究也不断深入。综合评价与决策逐渐成为一个多学科边缘交叉、相互渗透、多点支撑的新兴研究领域。从某种意义上来讲,没有评价就没有决策。评价是一种认知过程,是科学决策的前提,而决策是评价的最终目的。目前流行的几种现代综合评价、决策方法包括模糊综合评价、层次分析法、数据包络分析法、决策分析法、人工神经网络评价法、灰色综合评价法、组合评价法等等。各种评价、决策方法有简有繁,相互区别但又相互联系。各种评价、决策方法各具特色,对某类具体问题选择评价、决策方法提供了借鉴。基于篇幅的限制,本篇仅对模糊聚类分析、模糊综合评价、层次分析法、决策分析法介绍其基本原理、模型建立和求解方法,并讨论各方法在经济管理中的应用。
第九章 模糊聚类分析
1965年,模糊理论的创始人,美国加利福尼亚大学伯克利分校的计算机和自动控制理论专家L.A.Zadeh教授发表了题为“Fuzzy Set”的论文,这标志着模糊信息处理的诞生,并于20世纪60年代在各科学会议上,从模糊信息处理观点出发,阐述了他的理论。这一理论是描述和处理事务的模糊性和系统的不确定性,模拟人所特有的模糊逻辑思维功能,从定性到定量,创造了研究模糊性或不确定性问题的理论方法。Zadeh教授在随后的研究工作中,准确地阐述了模糊性的含义,制定了刻画模糊性的数学方法。即模糊集合、隶属度、隶属函数等,迄今已成为了一个较为完整的数学分支。
目前对模糊数学的研究十分活跃,模糊集合理论进一步丰富了经典数学的理论系统,为人们处理模糊信息提供了很多好的方法。现在,模糊数学的公理化基础已经建立,正接受实践的检验,并进一步得到完善。自从1976年模糊数学传入我国以来,通过广大模糊数学研究工作者的努力,模糊数学在我国得到了极大的发展,目前水平己居于世界前列。模糊数学在实际应用中几乎涉及到了国民经济的各个领域及相关部门,模糊数学在医学、气象、环境、农业、能源、军事、经济管理和地质勘探等方面都得到了广泛的应用。
从模糊理论诞生到今天四十年来,模糊理论和技术得到了迅速的发展,在这个领域国内外许多学者做了大量卓有成效的研究工作。模糊理论与技术的一个突出优点就是能较好地描述和模仿人的思维方式,并能总结和反映人的体会和经验,对复杂事务和系统可进行模糊度量、模糊识别、模糊推理、模糊控制与模糊决策。尤其是将模糊理论与人工智能在神经网络和专家系统等方面相互结合的研究已深入到计算机技术、多媒体技术、自动控制技术以及信息采集与处理技术等一系列高新技术的开发、研究与利用,为推动决策科学、应用科学、管理科学与社会科学的进步作出了极大的贡献。这种学术理论体系不断完善的新成果正在迅速地转变为生产力,促进了全人类社会物质文明的不断发展。
第一节 关系及分类
客观世界的各种事物之间存在着不同的相互关系。在数学上使用“关系”作为一种数学模型来描述事物之间的联系,例如,大小关系、次序关系、等价关系、兄弟关系、函数关系等。普通集合也存在关系。
181
1.关系的定义
定义9.1.1 从X到Y的关系是指论域为笛卡儿乘积(直积)XY的一个子集,即
RXY,称为从X到Y的二元关系。特别地,当XY时,称之为X上的二元关系。
二元关系统称为关系。
例1 设X{1,4,7,8},Y{2,3,6},定义关系Rxy,称R为“小于”关系。于是
R{(1,2),(1,3),(1,6),(4,6)}
这表明“小于”关系R是笛卡儿乘积XY的子集。
例2 设X{周一,周二,周三,周四,周五,周六,周日}和Y{晴,阴,雨}。
某一周的天气情况是:周一阴,周二雨,周三晴,周四晴,周五雨,周六雨,周日雨,则形成关系R{(周一,阴),(周二,雨),(周三,晴),(周四,晴),(周五,雨),(周六,雨),(周日,雨)},关系R是笛卡儿乘积XY的一个子集。
2.关系的表示法
关系可以分别用表格、图形和矩阵表示,下面以例2为例进行说明。 (1)表格。见表9-1
表9-1 关系的表格表示
R
晴 阴 雨
周一 0 1 0
周二 0 0 1
周三 1 0 0
周四 1 0 0
周五 0 0 1
周六 0 0 1
周日 0 0 1
(2)图形。见图9-1,如果(x,y)R,则连一条直线,否则不连。
论域X 论域Y 周一
晴
周二
周三 阴 周四 周五
周六 雨 周日
图9-1用连线图表示关系
(3)矩阵。见图9-2。
对一般情况,设论域为有限。关系R(rij)mn,i1,2,,m;j1,2,,n,rij{0,1}。
周一 周二 周三 周四 周五 周六 周日
0R1
0
00
1
100
100
001
001
0晴0阴 1雨
图9-2 关系的矩阵表示
3.特征函数
定义9.1.2 设A是论域X上的集合,记
182
A(x)
为集合A的特征函数。
1,xA
0,xA
特征函数A(x)表征了元素x对集合A的隶属程度。A(x)1表示xA,反之
A(x)0表示xA。
第二节 模糊关系及矩阵
在数学上,概念的外延可以通过“集合”来表达。然而,日常生活中涉及的众多的概念常有内涵的“模糊(Fuzzy)性”,这必然导致外延的“不清晰性”。例如,对于高矮之分等。正是考虑到现实世界中很多事物的分类边界是不分明的,而这种不分明的划分在人们的识别、判断和认知过程中起着重要的作用,为了用数学的方法来处理这种问题,扎德于1965年提出了模糊集合的概念。他用隶属度函数来刻画出中间过渡的事物对差异双方所具有的倾向性。可以认为隶属函数是普通集合中特征函数的推广。将特征函数的值域由{0,1}二值扩展到[0,1]区间时,就描述了一个模糊集合。
1.模糊集合隶属函数
~[0,1]上取值,A~(x)的值反映了X中的元素x对于A的隶属程度。
例1 设论域X{周一,周二,周三,周四,周五,周六,周日},从周一到周四是好
天气,周五到周日都是坏天气。按普通集合观点,特征函数为
定义9.2.1 论域X上的模糊集合A由隶属函数A~(x)来表征,其中~(x)在闭区间A
~
~
1,x(好天气)A~(x)A~,
A0,x(坏天气)
其隶属度为A~(周一)=1,~(周二)=1,~(周三)=1,~(周四)=1;~(周AAAA五)=0,A~(周六)=0,~(周日)=0。 A
利用模糊集合概念能较好区分好坏天气,选取[0,1]之间的数对天气情况进行细分。这时对于天气的隶属度可以写成A~(周一)=0.9,~(周二)=0.8,~(周三)=0.7,~
AAA(周四)=0.6;A~(周五)=0.3,~(周六)=0.2,~(周日)=0.1。 AA
2.模糊关系
~
R
定义9.2.2 设论域X和Y,称XY的一个模糊子集RXY为从X到Y的模糊二
~
Y。其隶属度函数为映射: 元关系,记为X
~:XY[0,1R]
这时隶属度R特别地,当XY时,称R为X上的~(x,y)表示x与y具有关系R的程度。模糊关系。
例2 论域X{100,150,200,250,300,350,400,450,500,550,600,650,700,750,800}(公斤/亩),Y{高产水稻}。
183
~~
由于全国各地的自然条件差异和生产水平不同,人们对水稻亩产多少才算高产的理解不一样,亩产量与“高产水稻”之间的关系是模糊关系。通过对不同地区种植水稻的123个农民的问卷调查,获得表9-2的结果。
表9-2 亩产量与“高产水稻”的模糊关系
公斤/亩 频数 累计频数 累计频率
100 1 1 0.01
150 2 3 0.02
200 5 8 0.07
250 10 18 0.15
300 15 35 0.27
350 18 51 0.41
400 25 76 0.62
450 20 96 0.78
500 15 111 0.90
550 3 114 0.93
600 3 117 0.95
650 2 119 0.97
700 2 121 0.98
750 1 122 0.99
800 1 123 1
表9-2中的累计频数就是XY的一个模糊子集R。将累计频数变换到[0,1]区间成为累计频率,这时累计频率就是隶属函数R~。~(500,高产水稻)=0.90表明亩产500公R斤与“高产水稻”的相关程度为90%。
定义9.2.3 设Q(qik)ml,R(rkj)ln分别为XY和YZ上的两个模糊关系。则Q
~
~~~
与R的合成,记为
~
~~~
QRS(sij)mn
其中sij(qikrkj)(i1,2,,m;j1,2,,n;k1,2,,l), ~~~
则S为矩阵Q与R的合成(也称为模糊矩阵乘积或模糊乘积)。其中“”与“”为逻辑符号,
分别表示取大、取小。
定义9.2.4 模糊关系R的传递闭包t(R)定义为:
~~~2~m~t(R)RRRRm。
m1
~~
由于
可见t(R)t(R)t(R),这个性质称为传递性。
集合论中的“关系”抽象地刻画了事物的“精确性”的联系,而“模糊关系”则从更深刻的意义上表现了事物间更广泛的联系。从某种意义上讲,模糊关系的抽象形式更接近于人的思维。在经济生活与经济科学中存在大量的模糊关系,而分类也是经济分析与经营管理中常常使用的方法,模糊关系理论是许多应用原理和方法的基础。
3.模糊矩阵
~~~
~~~~~
t(R)2t(R)t(R)R2R3
~~
i1,2,,m;j1,2,,nR,记,,,则称为模糊~(xi,yj)rRr[0,1]R(r)ijijijmn
矩阵。
定义9.2.5 设X{x1,x2,,xm},Y{y1,y2,yn},R是X到Y的模糊关系,记
~
例3 设X{x1,x2,,xm}是m个工作人员的集合,Y{y1,y2,yn}是n项工作的集合。若用rij[0,1]表示xi能胜任yj的程度,就可获得X到Y的模糊矩阵R(rij)mn。
~
~
设m4(即有4个工作人员),n5(即有5项工作),则模糊矩阵R:
0.3
~0.9R
0.70
0.80.40.30.10.400.70.2
0.70.50.60.2
0.40.7 0.7
0.6
184
例如第2个人能胜任第4项工作的程度为0.5。
~
R(rij)mn,若满足:
(1) 自反性:rii1(i1,2,,n) (2) 对称性:rijrji(i,j1,2,,n)
~~~
(3) 传递性:RRR
~
则称R(rij)mn为一个模糊等价矩阵,其关系是模糊等价关系。若只满足自反性和对称性
则为相似关系。
定义9.2.6 设论域X为有限集合,X上的一个模糊关系为R,与其对应的模糊矩阵为
~
~~~~~
t(R)Rk,对于一切大于k的自然数l,恒有RlRk。此时,t(R)为模糊等价矩阵。
~
下面介绍一个实用求传递闭包t(R)的简捷方法——二次方法。
定理9.2.1 设R是模糊相似矩阵,则存在一个最小自然数k(kn),使得传递闭包
10.10.2~~例4 设R0.110.3,求传递闭包t(R)。
0.20.31
解:容易验证,R是模糊相似矩阵,用二次方法求其传递闭包t(R)。
~~
10.10.210.10.210.20.2
~2~~0.110.30.210.3R0.110.3RR,
0.20.310.20.310.20.31
10.20.210.20.2~~~20.210.3RR2R20.210.3,
0.20.310.20.31
10.20.2
~~2。
0.3故传递闭包t(R)R0.21
0.20.31
4.模糊矩阵的-截矩阵
定义9.2.7 设R(rij)mn为模糊矩阵,对于任意的[0,1],称R(rij())mn为模糊矩阵R(rij)mn的-截矩阵,其中
~~
~
r
显然,截矩阵为布尔矩阵。
()
ij
1,rij 0,rij
10.50.20
~0.510.10.3
例5 设R,则当0.5时的-截矩阵为
0.20.110.800.30.81
185
1~1R
00
11000011
00。 11
第三节 模糊聚类分析的一般步骤
在科学技术、经济管理中常常需要按一定的标准(相似程度或亲疏程度)进行分类。例如,根据生物的某些性状可对生物分类,根据土壤的性质可对土壤分类等。对所研究的事物按一定标准进行分类的数学方法称为聚类分析,它是多元统计“物以类聚”的一种分类方法。由于科学技术、经济管理中的分类界限往往不分明,因此采用模糊聚类方法通常比较符合实际。
传统的聚类把每个样本严格地划分到某一类。随着模糊集理论的提出,传统聚类被推广为模糊聚类。在模糊聚类中,每个样本不再仅属于某一类,而是以一定的隶属度属于每一类。换句话说,通过模糊聚类分析,可得到样本属于各个类别的不确定性程度,即建立起了样本对于类别的不确定性的描述,这样就更能准确地反映现实世界。
模糊聚类分析步骤可以分为:数据标准化、建立模糊相似矩阵、聚类。
一、数据标准化
1.数据矩阵
设论域X{x1,x2,,xm}为被分类的对象,每个对象又由n个指标表示其性状,即
xi(xi1,xi2,,xin)(i1,2,,m),
于是,得到原始数据矩阵为
2.数据标准化
x11x21xm1
x12x22xm2
x1nx2n。
xmn
在实际问题中,不同的数据可能有不同的量纲。为了使不同量纲的数据也能进行比较,需要对数据进行适当的变换。根据模糊矩阵的要求将数据压缩到区间[0,1]。
通常需要做如下几种变换: (1)平移-标准差变换
xik
xikk
sk
(i1,2,,m;k1,2,,n),
1m1m
其中kxik,sk(xikk)2。 mi1mi1
186
经过变换后,每个变量的均值为0,标准差为1,且消除了量纲的影响。但是这样得到
还不一定在区间[0,1]上。 的xik
(2)平移-极差变换
xik
min{xik}xik
1im
}min{xik}max{xik
1im
1im
(k1,2,,n),
1,而且也消除了量纲的影响。 显然有0xik
(3)对数变换
lgxikxik
取对数以缩小变量间的数量级。
(i1,2,,m;k1,2,,n),
二、建立模糊相似矩阵
建立模糊相似矩阵又称为标定,即标出衡量被分类对象间相似程度的统计量rij。 设论域X{x1,x2,,xm},xi(xi1,xi2,,xin),依照传统聚类方法确定相似系数,建立模糊相似矩阵,xi与xj的相似程度rijR(xi,xj)。确定rijR(xi,xj)的方法主要借用传统聚类分析的相似系数法、距离法以及其他方法。具体用何种方法,可根据问题的性质,选取下列公式之一计算rij。
1.相似系数法 (1)数量积法
1,
rij1n
xikxjk,Mk1
其中Mmax(
ij
ijij
,
x
k1
n
ik
xjk)。
显然|rij|[0,1],若rij中出现负值,也可采用以下方法将rij压缩到[0,1]上:令
rij
rij12
[0,1]。 ,则rij
当然也可用上述的平移-极差变换。
(2)夹角余弦法
rij
x
k1
n
ik
xjk
x
k1
n
2ik
x
k1
n
2jk
(3)相关系数法
187
rij
|x
k1
n
ik
i||xjkj|
(x
k1
n
ik
i)2
(x
k1
n
,
jk
j)2
1n1n
其中ixik,jxjk。
ni1nj1
(4)指数相似系数法
2
1n3(xikxjk)rijexp[], 2
nk14sk
1m1m2
其中s(xikk),kxik
mi1mi1
2k
(k1,2,,n)。
(5)最大最小法
rij
min(x
k1nk1
n
ik
,xjk)
。
max(xmin(x
k1n
ik
,xjk)
(6)算术平均最小法
ik
,xjk)
。
rij
1n
(xikxjk)2k1
(7)几何平均最小法
rij
min(x
k1
n
ik
,xjk)
。
k1
n
xikxjk
2.距离法 (1)直接距离法
rij1cd(xi,xj),
其中c为适当选取的参数,它使得0rij1,d(xi,xj)表示xi与xj的距离。经常采用的距离有以下几种:
海明距离:
d(xi,xj)|xikxjk|;
k1
n
188
欧氏距离:
d(xi,xj)
切比雪夫距离:
(x
k11kn
n
ik
xjk)2;
d(xi,xj)max|xikxjk|。
(2)倒数距离法
1,
rijM,
d(xi,xj)
其中M为适当选取的参数,使得0rij1。
(3)指数距离法
ijij
rijexp[d(xi,xj)]
上述三种距离法中若采用海明距离,则又分别称为绝对值减数法、绝对值倒数法、绝对
值指数法。
3.主观评分法
请专家或有实际经验者直接对xi与xj的相似程度评分,作为rij的值。 (1)百分制
采用百分制,将评出的总分数除以100,即得闭区间[0,1]的一个rij。为降低主观性,可以请多个专家参与评分,再取平均定出rij。
(2)相似度和自信度
假定请N个专家组成专家组,这时有
rij
r(k)a
ijk1
N
ij
(k)
,
a
k1
N
ij
(k)
其中,rij(k)为第k个专家所给出xi与xj的相似度,aij(k)是专家对自己给出相似度时的自信度。rij和aij都是在[0,1]区间的数值。
三、聚类
1.模糊等价矩阵聚类 (1)传递闭包法
根据标定所建立的模糊矩阵R,不一定具有传递性,只是模糊相似矩阵。首先将R改造成模糊等价矩阵。根据定理9.2.1,用二次方法求传递闭包t(R)。再让由大变到小,就可形成动态聚类图。
例1 设论域X{x1,x2,,x10}表示农业小区域,已知每个小区域的气候取决于4个指标:热量、水分、霜冻、霜雹,即
189
~~
~
xi(xi1,xi2,xi3,xi4)(i1,2,,10),
其数值如表9-3所示。
表9-3 农业小区域及指标关系
由于所给数据xij0,且没有单位,所以直接选取数量积法建立模糊相似矩阵R,无需做变换。
① 用公式
~
1,
rij14
xikxjk,Mk1
的模糊相似矩阵R为
ijij
,
选取M使得对一切i,j,有0rij1。在本例中由数量积法可得M55.25。于是,得到
~
10.2310.2760.2990.2620.2130.2760.2760.3170.281
10.3030.3890.3170.4570.4300.4660.4620.38910.3710.3350.3390.3850.4030.4430.389
10.3980.6060.6240.6430.5790.471
10.4250.4800.4980.5070.434~
R
10.9190.9550.7330.552
10.9820.7690.588
10.8050.624
10.6331
~~2~4~4~4~4~~
②用二次方法求R的传递闭包t(R):RRR,RRR,得到模糊等价~~矩阵t(R)R4为
190
10.3170.3170.3170.3170.3170.3170.3170.3170.31710.4430.4660.4660.4660.4660.4660.4660.46610.4430.4430.4430.4430.4430.4430.443
10.5070.6430.6430.6430.6430.643
10.5070.5070.5070.5070.507~
t(R)
10.9550.9550.8050.633
10.9820.8050.633
10.8050.633
10.6331③将由大到小进行聚类 取1,X分为10类:{x1},{x2},{x4},{x6},{x7},{x8},{x9},{x10},{x5},{x3}。
取0.982,X分为9类:{x1},{x2},{x4},{x6},{x7,x8},{x9},{x10},{x5},{x3}。
取0.955,X分为8类:{x1},{x2},{x4},{x6,x7,x8},{x9},{x10},{x5},{x3}。
取0.805,X分为7类:{x1},{x2},{x4},{x6,x7,x8,x9},{x10},{x5},{x3}。
取0.633,X分为5类:{x1},{x2},{x4,x6,x7,x8,x9,x10},{x5},{x3}。
取0.443,X分为2类:{x1},{x2,x4,x6,x7,x8,x9,x10,x5,x3}。 取0.317,X分为1类:{x1,x2,x4,x6,x7,x8,x9,x10,x5,x3}。
(2)布尔矩阵法
设R是论域X{x1,x2,,xm}上的模糊相似矩阵,若要得到X的元素在水平上的分类,使用布尔矩阵的具体做法如下:
① 求模糊相似矩阵R的-截矩阵R,显然R为布尔矩阵。
② 判断R是否是等价的。如果R在任一排列下都没有下列形式的特殊子矩阵:
~
~~~
~~
11111001
10,01,11,11,
则R具有传递性,为等价矩阵,可以证明R为等价矩阵。
③ 如果判断R是等价的,则由R可得X在水平上的分类。
④ 如果判断R不是等价的,只要将R中上述特殊形式子矩阵的0一律改成1,直到不再出现特殊形式子矩阵为止,修改后的R为等价矩阵,可以获得水平上的分类。
例2 每个环境单元可以包括空气、水分、土壤、作物4个要素,环境单元的污染状况由污染物在4个要素中含量的超限度来描述,设论域X{x1,x2,x3,x4,x5}为5个单元,它们的污染数据如表9-4所示。
191
~~
~~
~
~
~
表9-4 环境单元污染状况
按绝对值减数法进行标定,取c0.1,由
rij10.1|xikxjk|
k1
4
得模糊相似矩阵
10.10.80.50.310.10.20.4~R10.30.1。
10.6
1
用布尔矩阵法分类:
取1,得
100001000~R1100,
10
1
X分为5类:{x1},{x2},{x3},{x4},{x5}。
取0.8,得
~R0.8
101001000100,
10
1
X分为4类:{x1,x3},{x2},{x4},{x5}。
取0.6,得
192
10R~0.6
1X分为3类:{x1,x3},{x2},{x4,x5}。
取0.5,得
101R~0.5
101先互换R~
0.5的第1、2行,再互换第1、2列,得
100R~
110.51再按布尔矩阵法进行改造,得
100R~
110.51X分为2类:{x2},{x1,x3,x4,x5}。
取0.4,得
101R~0.4
101先互换R~
0.4的第1、2行,得
0000, 11
1
10000011
,
1
001000,
11
1
001111,
11
1
10010011
,
1
193
~
.4R0
再按布尔矩阵法进行改造,得
1011010100,
1001101011
111111111~
.4R0111,
11
1
X分为1类:{x1,x2,x3,x4,x5}。
2.直接聚类
(1)直接聚类法
在建立模糊相似矩阵后,既不求传递闭包,也不用布尔矩阵法,而是直接从模糊相似矩阵进行聚类。其步骤如下:
①取11(最大值),对每个xi作相似类[xi]R~,且
~{xi|rij1[xi]R},
即将满足rij1的xi与xj放在一类,构成相似类。相似类与等价类的不同之处是,不同的相似类可能有公共元素,即可出现
~{xi,xj},[xj]~{xj,xk},[xi][xj]。 [xi]R
R
此时只要将有公共元素的相似类合并,即可得11水平上的等价分类。
②取2为次大值,从R中直接找出相似程度为2的元素对(xi,xj)(即rij2),将对应于11的等价分类中xi所在的类与xj所在的类合并,将所有这些情况合并后,即得对应于2的等价分类。
③取3为第三大值,从R中直接找出相似程度为3的元素对(xi,xj)(即rij3),类似的将对应于2的等价分类中xi所在的类与xj所在的类合并,将所有这些情况合并后,即得对应于3的等价分类。
④依次类推,直到合并到X成为一类为止。 (2)最大树法
~
~
194
以被分类元素为顶点,以相似矩阵R的元素rij为权重的一棵最大的树,取定[0,1],砍断权重低于的枝,得到一个不连通的图,各个连通的分支便构成了在水平上的分类。
下面介绍求最大树的克鲁克(Kruskal)法。
设X{x1,x2,,xn},先画出所有顶点xi(i1,2,,n),从模糊相似矩阵R中按rij从大到小的顺序依次画枝,并标上权重,要求不产生圈,直到所有顶点连通为止,这就得到一棵最大树。
例3 用最大树法求例2环境单元的分类。
解:论域X{x1,x2,x3,x4,x5},模糊相似矩阵
~
~
10.10.80.50.310.10.20.4~R10.30.1,
10.6
1
画出最大树,如图9-3(a)所示。
(a) (b) (c)
图9-3环境单元分类
(d) (e)
砍去最大树枝权重低于的枝,即得在水平上的分类。
取1,X分为5类:{x1},{x2},{x3},{x4},{x5},如图9-3(b)所示。 取0.8,X分为4类:{x1,x3},{x2},{x4},{x5},如图9-3(c)所示。 取0.6,X分为3类:{x1,x3},{x2},{x4,x5},如图9-3(d)所示。 取0.5,X分为2类:{x2},{x1,x3,x4,x5},如图9-3(e)所示。 取0.4,X分为1类:{x1,x2,x3,x4,x5},如图9-3(a)所示。 最大树法所得的结果与布尔矩阵法分类结果是一致的。
第四节 应用案例:模糊聚类分析法在经济管理中的应用
例1 亚洲玉米螟测报的数学模型。亚洲玉米螟是影响我国玉米生产的主要害虫之一。过去,人们对玉米螟种群动态的研究,一般仅考虑时间因子,即研究种群随时间变化的规律,也有从玉米螟空间格局加以研究的。
而本例是把种群的数量动态与空间格局联系起来加以研
195
究。同时还应指出,玉米螟的种群动态是一个具有模糊性的问题,玉米螟对玉米的危害程度也具有模糊性。因此,本例利用模糊数学方法,建立亚洲玉米螟测报的数学模型。
解 第一步:采集样本,确定主要因子,建立数据矩阵。
设论域X{x1,x2,,x26}是武汉地区1951-1985年间的历史资料(26个样本),每个样本由8个主要指标来描述,即 xi(xi1,xi2,,xi8)
8个主要指标的含义如下:
(i1,2,,26)。
xi1:上年7月、8月的平均气温;
xi2:上年12月,当年1、2月的平均气温; xi3:当年4月温湿系数;
; xi4:当年4月雨日数(降水量不小于0.1mm的天数)
xi5:当年4月日照数;
; xi6:当年4月风速(ms1)
xi7:当年5月上旬的温湿系数;
xi8:当年5月上旬田间调查的玉米螟卵块数。
由历史资料提供的原始数据如表9-5所示。
表9-5玉米螟原始数据
196
第二步:标定--建立模糊相似矩阵。
采用指数相似系数,第i个样本与第j个样本的相似系数为
2
183(xikxjk)rijexp[], 2
8k14sk
2
其中sk是第k个因子的方差,即
1261262
s(xikk),kxik。
26i126i1
2k
可得模糊相似矩阵R为
10.5510.536
10.5961
0.5130.579
0.4830.8260.5340.64710.667
1
0.679
0.4700.5500.472
0.5890.6810.7010.609
0.5270.8400.6180.4990.8420.5090.7991
0.4740.4850.4260.7680.6480.5080,5840.5231
0.6210.7800.7910.6430.9000.4990.7580.8340.5171
0.5580.4700.4620.855
0.7030.6580.5400.6070.5440.6830.7050.678
0.6810.4530.5540.695
0.5380.4780.6060.4760.3950.5500.4460.3970.4460.4700.3750.3900.6340.5161
0.6380.5750.6860.5950.5360.4750.5850.5390.4790.6400.6350.6740.8330.6270.6101
0.5920.6500.6550.6640.6860.5450.7640.7370.6340.7580.5930.7040.5980.5130.5431
0.5870.4830.5220.5800.4960.4740.5250.4920.4700.5480.5720.5320.5820.7550.6740.6151
0.5810.6610.6380.6710.5220.4860.7670.6130.6450.4690.6920.4010.6810.7050.6110.6170.7230.4090.5360.5190.6750.4030.5210.7490.6950.5600.7970.7210.4860.7080.5040.533
0.6850.6130.5720.5750.6500.7230.7240.7270.4660.7720.4800.642
0.5820.7180.5930.7080.6150.6080.5630.9150.680
0.4290.8100.6590.4970.4220.4920.4550.5370.5160.5640.5730.6680.5620.4780.6170.5990.5751
0.571
0.5240.652
0.545
0.7190.5590.8600.4650.4740.6040.6390.6010.7780.5700.7900.580
0.6370.4400.6890.5450.5450.7810.6910.4790.6890.4530.7350.578
0.4910.7620.6730.4930.5330.6370.7280.5720.6670.5460.7180.608
0.4030.5140.5180.5120.5090.3970.4250.5960.5980.3950.5430.701
0.6390.5780.6530.729
0.4750.4340.5400.4060.7660.4380.7170.647
0.5230.4300.5900.622
0.5230.4800.6040.7260.5510.4920.5370.666
10.4990.7900.610
10.6650.518
10.478
1
0.659
0.7420.6580.658
~
0.5130.73410.629
1
0.6240.6980.5440.6420.5830.6340.4850.5600.7580.5651
0.6980.6950.8581
0.6620.5310.5710.5430.6360.5740.5720.5210.6460.6350.7380.7231
0.4560.5990.7050.6190.6271
0.7130.5250.4860.6600.6210.4530.6850.6410.6930.4350.5021
0.6410.5590.5650.687
0.5630.63710.707
1
第三步:聚类。
(1)用二次方法求传递闭包t(R):RR2R4R8,RRR,得模糊等价矩阵t(R)R8为
~~~~~~8~8~8
~~
197
10.7030.7030.7030.703
10.7910.7280.84010.7280.79110.728
1
0.679
0.6790.6790.6790.6791
0.7030.7030.7990.8400.7910.7910.7280.7280.7990.6791
0.8420.6790.7991
0.7030.7030.7280.8400.7280.7910.7680.7280.7280.6790.7280.7281
0.9000.6790.7990.8420.7281
0.7030.7030.7030.7280.7280.7280.7280.7280.7280.8550.8550.7380.7030.7050.7050.7050.6740.6740.6740.6740.6740.6740.6740.6740.6740.6740.6740.674
0.7030.7030.7280.7640.7280.7640.7380.7280.7280.6790.7280.728
0.7640.6790.7640.764
0.7030.7030.7050.7970.7050.7910.7050.7280.7050.7970.6790.6790.7050.7970.7050.7970.7050.7280.7050.7970.7050.7280.7050.728
0.7280.7050.6740.7280.7640.7051
0.7030.7030.7720.7640.7720.7640.7280.7280.7720.6790.7720.772
0.7640.6790.7640.764
0.6790.6790.6790.6790.6790.8100.6790.6790.6790.6790.6790.679
0.7030.7900.7900.7280.7900.6790.7900.7900.7280.7900.7280.728
0.7030.7280.7280.7680.7280.6790.7280.7280.7810.7280.7680.768
0.7030.8400.7910.7280.8600.6790.7990.8420.7280.8600.7280.7280.7280.7050.6740.7280.7640.705
0.7280.7280.7280.7050.6790.6790.6790.6790.7280.7280.7280.7050.7280.7280.7280.7050.7680.7281
0.7680.7280.8581
0.7380.7280.7380.7381
0.7050.7050.7050.705
0.7380.7280.7280.7640.7380.7280.7380.7280.7280.7280.7720.7640.7280.7280.7280.728
0.7050.67410.674
10.8330.7280.7050.7050.7050.7550.6740.6740.6741
0.7281
0.7050.7051
0.7280.7280.6790.7050.7050.6970.6740.6740.6740.7280.7640.7050.7721
0.7280.9150.7050.7640.7641
0.6790.6790.6790.6790.6790.6791
0.7280.7380.7050.7050.6740.6740.7280.7640.7050.7900.7720.7640.6791
0.7380.7280.705
0.7280.7970.7280.7720.7280.6790.7281
0.7640.6790.7900.7281
0.703
0.7290.729
0.728
0.7290.6790.729
0.7290.7280.729
0.7280.7280.728
0.7050.6740.728
0.729
0.7050.729
0.729
0.7290.679
0.729
0.7280.729
1
(2)聚类。当由0.916降到0.679时,得到一系列等价的布尔矩阵R(省略)。 (3)根据武汉地区的实际情况,将玉米螟对玉米的危害程度划分为Ⅰ(轻)、Ⅱ(较重)、
Ⅲ(重)、Ⅳ(严重)4个等级。取0.7053,将原始样本分为4类。
Ⅰ类(危害轻年份):{x2,x3,x4,x5,x7,x8,x9,x10,x11,x12,x13,x14,; x16,x17,x18,x19,x20,x21,x23,x24,x25,x26}
Ⅱ类(危害较重年份):{x1}; Ⅲ类(危害重年份):{x6,x22}; Ⅳ类(危害严重年份):{x15}。
(4)回报与预测。将1986年和1987年的有关因子的8个数据输入上述模型,经过运算,同样取0.7053,可以判定:1986年和1987年归并Ⅰ类,即这两年为危害轻年份。
类似地,将要预测年份的有关8个因子的数据输入上述模型,经过运算,同样可判定该年份归并哪一类,即可判定该年份危害的轻重程度。此模型对防治玉米螟有一定的实用价值。
例2 模糊聚类分析在市场划分中的应用。在市场经济条件下,市场划分是一项重要的战略措施,它有许多显著的特点:
①使企业的产品经销有针对性,可以更好地满足顾客的需求; ②在市场经营上便于专业化,销售人员可以集中力量对一些特定顾客进行宣传和推销,从而提高市场经营的效果。因此,将市场动态地划分为各个层次的若干种类群是很有意义的。
由于在给定的一个市场中,顾客的购买行为是有差异的,因而,根据对顾客购买行为的差异的观测数据,可将市场进行划分。例如,设一个市场具有m个顾客和n种商品,那么,可以用矩阵A(aij)mn来表示顾客的购买行为,其中aij表示第i个顾客对第j种商品的购买行为的程度。
解 第一步:设论域X{x1,x2,,x20}(20个国家和地区)。
以一个国家或地区作为一个需求单位,每个国家或地区用10个特征指数来衡量(如,地理指数——地理位置、人口密度等;人口状况指数——生活方式、商品使用率等;经济指数——国民生产总值、进出口贸易总值等;社会结构指数——君主立宪制、议会制等),即
~
xi(xi1,xi2,,xi10)(i1,2,,20),
原始数据如表9-6所示。
198
表9-6国际市场划分原始数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
美国 加拿大 墨西哥 澳大利亚 中国香港 印度 日本 新加坡 泰国 埃及 伊朗 黎巴嫩 摩洛哥 索马里 赞比亚 苏丹 韩国 巴基斯坦 秘鲁 马来西亚
1
2112.000 197.470 92.616 116.249 13.680 117.656 1053.320 8.121 21.785 18.761 19.274 3.086 13.329 0.249 -2.900 5.307 47.583 19.727 8.894 16.249
2
7.590 1.906 1.961 1.485 1.485 6.064 18.839 5.822 2.113 0.991 6.745 1.926 0.231 0.069 0.064 0.048 2.488 0.511 1.795 8.379
3
6172.3 4801.8 883.8 4955.5 2257.1 121.3 5305.0 2138.3 313.3 296.8 627.3 1262.5 478.9 252.9 252.9 244.8 794.7 215.0 400.8 881.8
4
6.963 0.838 0.405 0.405 0.047 13.794 1.170 0.011 0.263 0.375 0.011 0.062 0.018 0.021 0.021 0.003 0.542 0.146 0.386 0.094
5
218.927 56.825 12.086 18.232 17.137 8.150 110.670 17.635 7.156 8.837 7.261 2.414 3.807 0.440 0.756 1.110 20.399 4.061 2.146 7.849
6
-37.125 1.358 -3.104 0.443 -2.305 -1.710 -7.625 -3.402 -1.848 -1.997 11.739 -1.709 -1.935 -0.258 0.572 -0.575 -5.284 -1.025 1.386 3.228
7
552.953 716.070 586.240 717.144 664.956 363.565 206.142 515.021 554.279 570.578 794.799 595.918 573.074 564.102 664.776 637.408 516.577 315.374 510.493 580.209
8
8 98 98 98 8 38 8 8 38 38 68 38 68 68 68 68 98 38 38 68
9
93 93 93 122 4 4 4 4 4 33 4 4 33 33 33 33 4 4 93 4
10
23.5 2.4 354.9 1.9 4530.0 198.0 312.4 83.0 83.0 40.8 27.7 299.0 43.9 5.6 7.6 7.1 383.8 99.2 13.6 100.0
第二步:标定。 用欧式距离公式
rij1c
(x
k1
n
ik
xjk)2
来定义两个需求单位之间的需求相似程度,这样一来,市场的动态划分问题就转化为20阶矩阵的动态聚类分析问题。所建立的相似矩阵为
10.6290.1110.631
10.3830.97210.359
1
0.0080.0000.7730.2860.0240.0220.0700.1610.0480.0140.0140.0130.0950.0090.0370.107
0.1850.2630.8170.5800.2950.2930.3450.4420.3210.2860.2860.2850.3680.2770.3090.3840.3110.8720.2880.7970.8990.8940.9250.9360.9180.8860.8850.8840.9760.8780.9050.956
0.1730.2390.8150.5560.2710.2690.3210.4180.2980.2620.2630.2610.3440.2540.2850.36110.2410.1650.3020.2390.2320.2490.3190.2440.2240.2250.2240.3100.2330.2340.273
10.1740.6820.9510.9480.8910.8160.9280.9480.9370.9410.8870.9730.9390.874
10.4740.1980.1950.2420.3420.2230.1880.1860.1860.2740.1850.2110.285
10.7140.7110.7590.8580.7390.7040.7030.7020.7840.6970.7270.803
10.9910.9370.8470.9720.9830.9760.9780.9100.9590.9760.911
10.9370.8430.9710.9890.9820.9850.9040.9570.9780.908
10.8870.9580.9310.9380.9350.9240.9000.9410.947
10.8710.8350.8350.8340.9240.8270.8560.932
10.9640.9610.9610.9260.9410.9810.936
10.9840.9880.8960.9570.9730.900
10.9950.8940.9430.9650.899
10.8930.9470.9670.899
10.8930.9130.952
10.9540.887
10.921
1
第三步:聚类。
199
用二次方法求传递闭包t(R):RR2R4R8,RRR,得模糊等价矩阵
~~~~~~8~8~8
~~t(R)R8为
10.7730.5800.773
10.5800.97210.580
1
0.3190.5800.7730.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.580
0.3190.5800.8170.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.3190.9470.5800.8580.9470.9470.9470.9360.9470.9470.9470.9470.9760.9470.9470.956
0.3190.5800.8170.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.58010.3190.3190.3190.3190.3190.3190.3190.3190.3190.3190.3190.3190.3190.3190.319
10.5800.8580.9590.9590.9580.9360.9590.9590.9590.9590.9470.9730.9590.947
10.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.5800.580
10.8580.8580.8580.8580.8580.8580.8580.8580.8580.8580.8580.858
10.9910.9580.9360.9780.9890.9880.9880.9470.9590.9780.947
10.9580.9360.9780.9890.9880.9880.9470.9590.9780.947
10.9360.9580.9580.9580.9580.9470.9580.9580.947
10.9360.9360.9360.9360.9360.9360.9360.936
10.9780.9780.9780.9470.9590.9810.947
10.9880.9880.9470.9590.9780.947
10.9950.9470.9590.9780.947
10.9470.9590.9780.947
10.9470.9470.956
10.9590.947
10.947
1
取0.817,国际市场划分成4类:{x1};{x2,x4,x7};{x5};{x3,x6,x8,。 x9,x10,x11,x12,x13,x14,x15,x16,x17,x18,x19,x20}
第一市场组群:美国,最发达国家或地区;
第二市场组群:加拿大、澳大利亚、日本,工业发达国家或地区; 第三市场组群:中国香港,自由贸易区; 第四市场组群:其他15个国家或地区。
取0.773,国际市场划分成3类:{x1,x2,x4,x7};{x5};{x3,x6,x8,x9,。 x10,x11,x12,x13,x14,x15,x16,x17,x18,x19,x20}
第一市场组群:美国,加拿大、澳大利亚、日本; 第二市场组群:中国香港;
第三市场组群:其他15个国家或地区。
由此可见,模糊聚类分析恰好反映了国际市场的动态市场划分,便于制定进出口商品结构,用以指导国际贸易活动。
习题九
10.10.20.3
~0.110.10.2~
1. 设R,求传递闭包t(R),并做聚类图。
0.20.110.10.30.20.11
200
0101
0.10~2. 设R01
0.80
10.80.61
0.100.81
0110.810.70.600.7100.90.6010.700.1
0.90.70
10.50.4
0.6
10.1~
0,试求传递闭包t(R),并做聚类图。 0.50.41
1
0.4
0.10.4
~
0.9,求与R对应的模0.10.51
1
0.90.7~
3. 已知模糊相似关系矩阵R0.5
0.910.4
0.90.70.50.9
10.50.40.50.40.510.50.70.10.40.510.50.70.50.70.510.70.40.10.70.7
1
0.10.40.90.10.5
糊图的最大树,并用最大树法求聚类图。
4. 设有A、B、C、D、E、F共6个地区,其空气、水、土壤、农作物等4个方面受到了
不同程度的污染,有关指标如下:A(5,5,3,2)、B(2,3,4,5)、C(5,5,2,3)、D(1,5,3,1)、
E(2,4,5,1)、F(3,4,4,5)。试选定适当公式计算它们两两之间的相似关系,并做模糊聚
类分析。
5. 设有四种产品,他们的指标如下:
X1(37,38,12,16,13,12), X2(69,73,74,22,64,17), X3(73,86,49,27,68,39),X4(57,58,64,84,63,28)。
试用相关系数法建立相似矩阵,并用传递闭包法进行模糊聚类。
6. 桔全爪螨是我国柑桔产品的主要害虫之一。为了研究桔全爪螨的生存和发展规律,基地
在3~6月共4个月时间由大约每隔5天一次测量了3个指标。
(1)x1:样本平均密度,单位头/叶; (2)x2:聚块性指标,即(m(3)x3:有虫叶出现频率。 现将共17次的测量结果列在表9-7中。
表9-7 桔全爪螨测量结果
序号 1 2 3 4
v
1)/m,这里m是样本均值,V是样本方差; m
x1
0.24 0.58 0.77 1.03
x2
9.507 6.708 7.645 7.429
x3
0.13 0.21 0.26 0.32
调查时间(月.日)
3.10 3.15 3.20 3.25
201
5 6 7 8 9 10 11 12 13 14 15 16 17 1.03 1.20 1.76 2.12 3.85 3.35 4.37 6.07 8.46 15.12 28.45 2.18 0.83 4.808 3.646 4.952 3.579 2.907 2.216 3.404 3.374 2.885 1.850 1.427 3.959 3.424 0.37 0.43 0.46 0.55 0.75 0.79 0.78 0.87 0.87 0.95 0.99 0.56 0.37 3.30 4.04 4.09 4.14 4.19 4.24 5.04 5.09 5.14 5.19 5.24 6.10 6.21
因为各指标的量纲都不一致,先按下式:
x
ij
xijj
j
,i1,2,,17,j1,2,3
做无量纲处理(式中xij表示第i次测量时所得的第j个指标。j,j分别是xj的均值与均方差)。再选择适当的公式,对无量纲处理后的数据建立各次测量结果之间的相似关系。
202