数学建模案例分析--模糊数学方法建模2小麦品种的模糊模式识别
§2 小麦品种的模糊模式识别
把一批来自同一品种的小麦称为一个小麦亲本。小麦有各种不同的品种,某一品种的小麦有它自己的很多特性,如抽穗期、株高、有效穗数、主穗粒数和百粒重量等数量性质。然而对于小麦的一个亲本,我们不能凭其中某一粒或某一株小麦去鉴定它的品种。实际上,同一品种的小麦中,各株小麦的抽穗期显然是不完全相同的。在同一种小麦中,百粒重量的每一次样本也是不完全相同的,但总是在各自的均值附近摆动。这样我们就可以把某一品种的小麦看成是一个模糊集。不同品种的小麦就对应着不同的模糊集。如果能肯定待识别小麦亲本的模糊集与某一已知品种小麦的模糊集最贴近,那就可以断言它属于该种小麦了。
由于模糊集合是用隶属函数来表示的,而隶属函数又不同于普通的函数,怎样来度量模糊集的模糊性以及怎样比较两个模糊集是否相贴近还是差别很大,这就要引入一些有关模糊集度量的概念。
一、单个模糊集度量 1、模糊度
在论域U上的任意模糊子集A的模糊度D(A)应满足:
~
~
(ⅰ)对任意的xU,当且仅当x对A的隶属度A(x)只取0和1时,D(A)=0 ;
~
~
~
(ⅱ)当A(x)=0.5时,D(A)应取最大值,即D(A)=1;
~
~~
(ⅲ)对任意的xU,设U的两个模糊子集A和B,若A(x)B(x)0.5或
~
~
~
~
A(x)B(x)0.5,则有D(B)D(A)。
~
~
~~
2、模糊熵
在模糊数学中,用模糊熵描述模糊度,是模糊集合所含模糊性大小的一种度量,这里仅介绍较其它方法为好的仙农函数引出的模糊熵定义。 设A是论域U上的任意模糊子集,当xU时,记
~
H(A)
~
S(nln2
i1
1
A
~
(xi))
叫做模糊集A的熵,此处S(x)xlnx(1x)ln(1x)。
~
容易验证,上述模糊熵满足模糊度的三个条件。 二、多个模糊集度量 1、海明距离
设论域U上的两个模糊子集A和B,它们之间的海明距离定义为
~
~
n
d(A,B)
~
~
i1
A(xi)B(xi)
~
~
这个定义适用于论域为有限集时,n是论域中元素的个数,它又称为绝对海明距离。在实用中常
应用相对海明距离,其定义为 (A,B)
~
~
1n
d(A,B)
~
~
1
n
n
i1
A(xi)B(xi)
~
~
还有加权海明距离和相对加权海明距离如下:
n
d(A,B)
~
~
(x
i1
i
)A(xi)B(xi)
~
~
(A,B)
~
~
n
1
n
i
(xn
i1
)A(xi)B(xi)
~
~
这里(xi)1。
i1
2、贴近度
设论域U上的两个模糊子集A和B,我们引进它们之间的两种运算,它们是:
~
~
AB[A(x)B(x)]
~
~
xU
~
~
AB[A(x)B(x)]
~
~
xU
~
~
我们称AB为模糊集A和B的内积,AB为模糊集A和B的外积。我们定义
~
~
~
~
~
~
~
~
(A,B)
~
~
12
[AB(1AB)]
~
~
~
~
为模糊集A和B的贴近度,它显然也是一个[0,1]上的数。
~
~
3、正态型模糊集
设论域U为实数域,模糊集A的隶属函数为A(x)exp{(
~
~
xa
)},称这种形式的模糊
2
集为正态模糊集,这里0。
现有两个正态模糊集A和B,它们的隶属函数分别为
~
~
( A(x)exp{
~
xa1
1xa2
)}
2
(10)
( B(x)exp{
~
2
2
)}
2
(20)
可以求得ABexp{(
~
~
a1a2
12
12
)},AB0,
~
~
于是正态型贴近度为(A,B)
~
~
[exp{(
a1a2
12
)}1] (1)
2
4、择近原则
设A1,A2,,An,B是论域U上的任意模糊子集,若
~
~
~
~
(Aj,B)(Ai,B)
~
~
1in
~
~
则认为B与Aj最贴近,应把B划归为Aj模式。
~
~
~
~
三、小麦品种的识别
设有五种小麦优良品种,它们是早熟、矮杆、大粒、高肥丰产、中肥丰产。为简单起见,我们只取百粒重这一特性来考察。根据抽样结果,由数理统计可得到它们分别是如下几种正态模糊集。
~
现有一种不知品种的小麦亲本B,也是正态模糊集。用统计方法测得其参数为a3.43,0.28,于是由(1)可以计算出
(A1,B)0.91;(A2,B)0.72;(A3,B)0.50;(A4,B)0.76;(A5,B)0.89
~
~
~
~
~
~
~
~
~
~
按择近原则,亲本B属于早熟型。
~
一般来讲,仅依照小麦的一种特性—如百粒重量来判别小麦的亲本,并非十分合理。通常要同时考察小麦的几种特性。
如果现在同时考察小麦的五种特性,则对于每一个品种(模式)的小麦,它的每一个特征都是论域U上的一个模糊子集。对五种小麦,考察它们的五种特性,共有25个模糊集,用下表的记号表示。
每一个待识小麦的亲本都可以测得它的特性,因此待识别的小麦亲本可有五个模糊子集
B1,B2,B3,B4,B5。其中Bj就是亲本关于第j种特性的模糊子集。
~
~
~
~
~
~
小麦亲本是属于哪一品种的小麦呢?首先确定出Aij的隶属函数和Bj的隶属函数,然后计算
~
~
出所有的贴近度(Aij,Bj),(1i,j5)计算结果见下表。
~
~
从表中可见,按择近原则,若以第三特性有效穗数来识别,则亲本应属于早熟型;但若以第四特性主穗粒数来识别,则应属于矮杆或中肥丰产型。由此可见,全体识别即单纯依靠某一种特性来识别是不行的。设想若亲本属于某一类,则它的每个特性都应该与该类的相应特性接近。为此我们引入参数Si(Aij,Bj)1i5,它代表B与第i类的每一特性的贴近度的最小值。其意义表
1j5
~
~
~
示亲本B同时具有第i类品种的每一个特性的贴近程度。
~
求得Si后,则选Si0Si,表示所有的Si值中选最大值,则认为亲本B为i0类。
1i5
~
例如,在上例中Si的值见表中最后一行,Si0SiS50.48,因而得到亲本应识别为第五
1i5
种模式,即中肥丰产型。