基于形状的小波变换系数广义高斯分布图像检索算法
第5期2003年5月
电 子 学 报
ACT A E LECTRONICA SINICA V ol. 31 N o. 5
M ay 2003
基于形状的小波变换系数广义高斯分布图像检索算法
汪祖媛1, 庄镇泉2, 何劲松1, 王煦法1
(11中国科学技术大学计算机科学与技术系, 安徽合肥230027; 21中国科学技术大学电子科学与技术系, 安徽合肥230026)
摘 要: 本文提出一种基于小波变换系数的广义高斯密度分布形状检索算法. 该算法充分利用小波变换变换系
数的统计特性, 形成描述形状特征的特征矢量. 实验证明, 算法提出的描述方式能够有效体现物体形状特征. 同时, 算法对于形状的尺度变化, 平移变化以及旋转变化有着很好的抑制能力. 该算法简单, 有效, 是一种有效的基于形状的图像检索算法.
关键词: 小波变换; 广义高斯密度分布; 图像检索中图分类号: TP391 文献标识码: A 文章编号: 037222112(2003) 0520765204
Wavelet Coefficients Generalized Gaussian Distribution Image
Retrieval Algorithm Ba sed on Shape
W ANG Zu 2yuan 1,ZH UANG Zhen 2quan 22s ong 11
(11Computer Science &Technology , , fei 230026, ;
21Electronic Science &Technology , , )
:on by using wavelet coefficients G aussian density distribution. This of by taking advantage of the statistical attribution of wavelet trans formation coeffi 2cients. that the extracted feature vector can depict the shape outline accurately ,and remain invariant to the image ’s scale and rotation. It is an efficient image retrieval method based on the shape content.
K ey words : wavelet trans formation ;generalized G aussian density distribution ;image retrieval
1 引言
基于内容的图像检索———C BIR (C ontent Based Image Re 2
trieval ) 技术在对海量的数据进行检索时是一个非常有效的途径[1]. 而形状特征是描述图像的关键要素之一, 它可以较好地反映出区域的特征, 因此该特征是C BIR 技术中一个比较重要的可利用因素. 在最近的一些图像检索系统中, 著名的QBIC [2]检索系统采用统计特征, 如面积, 圆心度, 偏心矩等来描述物体的形状特征. Photobook [3]是一个实现图像序列检索的实用系统. 该系统通过度量两个物体形状之间的变形度来比较两者的相似性. 这些算法的共同点在于大都依据一个单一的模型以及与其相联系的描述形状的特征矢量. 而采用单一的模型来实现检索时, 针对不同的应用对象有时算法不一定能够提取相应的描述图像的特征矢量. 另外, 有许多的形状特征对于图像的大小, 位置以及方向没有很好的稳定性.
针对上述问题, 本文提出一种形状边缘小波变换系数的广义高斯模型算法. 该方法利用广义高斯函数来描述图像小波变换系数的统计特性, 从而实现基于形状的图像检索功能.
算法的特点在于其提取的特征矢量能够较好的描述图像的形状特征, 进而有效提高了图像的检索精度. 算法对于形状的尺度变化, 平移变化以及旋转变化有着很好的抑制能力. 实验表明, 该算法的检索结果较传统的不变矩算法, 检索精度大大提高, 是一种有效的基于图像形状特征的检索算法.
2 小波变换系数的广义高斯密度分析
一般来说, 图像检索过程是先将图像经过一定的变换后至一个合适的参数空间, 而在这个参数空间内能够用较少的参数来描述原有的数据内容. 由于小波变换[4, 5]能对图像进行多分辨率的描述, 且不需要很多的参量, 所以它是近年来一个有效的处理图像检索的变换工具. 211 小波变换系数的统计特性
图像的离散小波变换通常运用高通滤波器H 和低通滤波器L 对图像进行水平和垂直方向的滤波. 在小波频域内, 低通子带的系数称为尺度系数, 而其他子带的系数则称为小波系数. 由于H 满足高通条件, 即H (z ) |z =1=0, 因此, 任一子带的小波系数的均值都等于或近似等于0.
收稿日期:2001211229; 修回日期:2002212228
基金项目:973国家重点基础研究发展规划项目(N o 1G 1998030500) ; 高等学校博士点专项科研基金
(N o [1**********])
766 电 子 学 报
213 基于广义高斯概率密度的相似度度量方法
2003年
图1为一幅鱼的灰度
图像, 图2为该图像在空间域(灰度直方图) 和变换域
(小波变换系数直方图) 的
统计特性图. 从图2中可以看出, 原始图像的灰度在大范围内分布, 且相关性较
图1 原始图像
强, 熵值较大. 而小波系数
在零值附近高度集中, 单为零的系数高达77%, 较好地去除了相关性, 减小了熵值. 而且, 小波变换系数直方图可以用一系列概率密度函数来近似描述[6]. 基于上述分析, 我们由此提出一种小波变换系数高斯概率分布的形状检索方法
.
上述可知, 若给定了广义高斯概率模型, 子带小波变换系数的直方图可以用α和β来描述. 同时, 如果用K ullback 2Leibler Distance (K LD ) 距离[8]来计算两个不同的直方图之间的相似度, 其相应的K LD 距离可以表示为:
βαΓ(1/β)
D (P (. ; α1, β1) ‖p (. ; α2, β2) ) =β2α1Γ(1/β1)
β
2Γ((βα+1) /β) (7) +α-Γ(β) β1/211
从式(7) 中, 可以看出, K LD , 两个尺度参数的比值α1/α2, 形状参数β1及β2. 因此, 图像之间的相似度转化为以尺度参数α和形状参数β为变量的K LD 距离函数.
3 基于平面曲线的形状边缘小波变换算法
在实验中发现, 不同的形状图像, 具有不同的小波变换系数直方图, 如图
3所示. 因而其相应的尺度参数α和形状参数β可以区分不同的形状图像. 根据式(7) , 中两幅图像之间的距离(; α1, ) p ; 2) =图2 212 实验显示含有两个变量α, 能够取得较为理想的结果[6, 7]. 该函数定义如下:
ββ(α)
) =(1) p (x ; α, βe -|x |/
Γ(1/β) 2α
其中, Γ(1) 函数为:
Γ(z ) =
e ∫
∞
-t z -1
t dt , z >0(2)
上式中, 参数α模拟了概率密度函数的顶点, β则反比例于顶点的下降速率. 因此, α有时被称为尺度参数, β被称为形状参数.
设子带小波变换系数直方图X :=(x 1, x 2, ……, x L ) 可以描述成:
L
) =log L (x ; α, β
i =1
∏p (x ; α, β)
i
(3)
图3 形状图像的广义高斯密度函数示意图
文献[7]指出, 如果β>0, 可以得出:β=F -1(m 1/
m 2) ; F (x ) =Γ(2/x ) /
(1/x ) Γ(3/x )
(4)
m 1和m 2分别满足:
m 1=(1/L )
i =1
|x |∑
i
L
, m 2=(1/L )
i =1
∑x 2
i
L
(5)
同时α满足,
α=m 1×(Γ(1/β) /Γ(2/β) )
(6)
在实际求解过程中, 式(4) 的解可以通过插值和对应查表
的方法来得到. 即代入任一β值, 使F (β) =Г(2/β) /(1/β) /Γ(3/β) 最接近m 1/
m 2的β值, 即为所求解.
显然这种基于小波变换系数的广义高斯模型可以有效检
索出不同的形状图像. 但是, 如表1所示, 当某幅图像(图3
表1 不同旋转角度下的α和β值(a ) ) 发生旋转变化时, 其
对应的尺度参数α和形αβ旋转角度
0°[1**********]0
状参数β也相应发生变
[1**********]0化, 因此根据α和β计算
[1**********]70的图像相似度也将发生相
270°[1**********]0
应的变化. 也就是说, 这种模型对于旋转检索问题缺
乏不变性. 针对上述问题, 我们提出基于形状边缘小波变换的算法,
第 5 期汪祖媛:基于形状的小波变换系数广义高斯分布图像检索算法767
该算法充分利用图像的边缘信息, 根据平面曲线的小波变换系数对尺度, 旋转具有不变性的优点, 形成灵活的特征表达, 从而有效实现了基于广义高斯模型的形状图像检索. 该算法有很好的通用性, 适用于不同大小的图像, 并且不受旋转, 平移对于旋转图像产生的影响. 311 图像形状边缘产生
由于图像数据库中的图像是各种各样的, 我们需要对这些图像进行一些预处理工作. 如图4所示, 首先, 我们提取每幅图像(图4(a ) ) 的边缘图像(图4(b ) ) , 然后对提取的二进制边缘计算其二进制闭包(图4(c ) ) . 对于形成的二进制闭包图像, 我们再进行保留边界象素的处理, 即如果一个象素4
个相邻全是1, 则设置其为0. 图像经过上述处理后, 形成一具有闭合曲线, 能够描述原始图像边缘信息的二值图像(图4(d ) ) .
这样, 我们对形成的原始图像的形状边缘图像(图4(d ) ) 进行小波变换, 并计算相应的小波变换系数直方图的广义高斯密度函数近似表达. 最后, 根据得出的尺度参数α和形状参数β值, 由式(7) 计算不同图像之间所对应的K LD 距离. 表2列出了用该幅图像在不同的旋转角度下, 其形状边缘小波变换系
表2 不同旋转角度下的形状数对应的尺度参数α和
边缘对应的α和β值形状参数β. 可以发现, 其
相应的α和β值变化非常αβ旋转角度
0°[1**********]微小. 因此, 提出的形状边
90°[1**********]缘小波变换思想保证了算
180°[1**********]法对于旋转的不变性, 而
270°[1**********]
这一点对于形状检索来说是至关重要的.
4 , 性. 表3, β随, 但是α相对来说变化的幅度稍大些. 这是因为不同的尺度下, 算法提取的边缘特征有所不同, 因此小波变换形成的子带图像其均值相应有所变化. 而式(6) 表明, α与相应的子带图像的均值成正比, 这就造成α相对来说变化较大. 总体上, 形状参数β保证了广义高斯模型在形状上与小波变换系数的相似性, 因此算法所提取的尺度参数α和形状参数β对于尺度变化有一定的抑制能力.
表3 不同大小的图像形状边
缘对应的α和β值图像大小
2803252(原始图像)
[***********]2804803440
α
[***********][1**********]7
.
比较图5和图6,
可以发现, 当用户查询图像为背景单一的形状图像时, 提出的算法其检索效果要明显好于传统的不变矩算法. 在算法检索出的与用户查询图像最为相似的前11个图像集中, 基于形状边缘小波变换系数广义高斯密度模型算法所检索出的图像大都与查询图像较为相似, 其检索精度远远高于不变矩算法. 图5(b ) 和图6(b ) 所作的实验是测试两种形状检索算法对于图像大小以及旋转的稳定程度. 当查询图像为一自然背景图像时, 在检索出的前11个结果中, 不
β
[***********]9001180
4 实验结果对比和分析
由于不变矩函数不随物体的旋转, 尺度以及平移变化而变化, 因此该特征被广泛用来描述形状特征[9]. 对于一个给定的二维图像f (x , y ) , 它的p +q 阶中心矩可以表示为:
μpq =
∑∑(x -x
y
x ) p (y - y ) q f (x , y )
(8)
选取图像的七个二阶和三阶矩函数(M 1-M 7) 作为描述其内
容的特征矢量, 图像的相似性度量采用欧式距离. 实验中处理的对象为一个包含有300多幅的各种鱼类图像数据库. 图5
(a ) 、(b ) 为检索对象不同时, 采用不变矩方法的图像检索结(b ) 即为当用户查询图像与图5(a ) 、(b ) 相同时, 果. 图6(a ) 、
图5 (a ) 不变矩算法检索结果1;
(b ) 不变矩算法检索结果2
768 电 子 学 报2003年
[2] Flickner M ,et al. Query by image and video content :theQBIC system
[J].IEEE C om puter ,1995,28(9) :23-32.
[3] Pentland A ,et al. Photobook :T ool for content 2based manipulation of
image databases [J].International Journal of C om puter Vision ,1996, 18(3) :233-254.
[4] G Van de W ouwer ,P Scheunders ,D Van Dyck. S tatistical texture char 2
acterization from discrete wavelet representations [J].IEEE T rans on Image Processing ,1999,8(4) :592-598.
[5] S M allat. A theory for multires olution signal decom position :Thewavelet
representation [J].IEEE T rans PAMI ,1989,11(7) :674-693.
[6] M inh N D o ,M artin Vetterli. W avelet 2based texture retrieval using G en 2
eralized gaussian density and kullback 2leibler distance [J ].IEEE T ransactions on Image Processing ,2002,11(2) :146-158.
[7] M K Varanasi ,B Aazhang. Parametric generalized G aussian density es 2
timation [J].j. Acoust. S oc. Amer ,1989,86:1404-1415.
[8] S K ullback ,R A Leibler. On in formation and su fficiency [J].Annual
M ath. S tat. 1951,22:79-86.
图6 (a ) 基于广义高斯模型算法的检索结果1;
(b ) 基于广义高斯模型算法的检索结果2
[9]
S A Dudani , KJ Breeding ,R B M cG hee. Aircraft identification by m o 2
ment invariants [J
].IEEE T rans on C om puters ,C 226:39-45.
变矩算法仅检索出2个合乎要求的图像, 其中一个为原始图
像, 另一个为原始图像逆时针旋转90度的图像. 而基于小波变换系数广义高斯密度模型算法可以检索出5结果集. 其中, 不仅包含原始图像、90度, 逆时针旋转90度, , . . 这种算法因而具有较强的通用性, 适合于不同内容的基于形状信息的图像数据库检索. 由此可见, 我们提出的基于形状边缘图像小波变换系数的广义高斯密度分布形状检索算法能够有效体现物体形状特征. 该算法的检索结果较传统的不变矩算法检索结果, 检索精度大大提高. 算法充分利用小波变换变换系数的统计特性, 并采用广义高斯模型形成描述形状特征的特征矢量. 而提取的特征矢量能够较好的描述图像的形状特征, 进而有效地提高了检索精度. 另外, 算法对于形状的尺度变化, 平移变化以及旋转变化有着很好的抑制能力, 是一种较好的基于形状特征的图像检索算法. 参考文献:
[1] 黄祥林, 沈兰荪. 基于内容的图像检索技术研究[J].电子学报,
2002,30(7) :1065-1071.
:
女,1973年5月生于安徽省合肥市, 中国科学技术大学计算机科学与技术系博士后, 主要从事智能信息检索、图像处理等方面的研究工作, 在国内外重要期刊上已发表论文十多篇.
庄镇泉 男,1938年4月生于福建省泉州市, 中国科学技术大学电子科学与技术系博士生导师, 主要从事信息处理, 大规模集成电路等方面的研究工作.
何劲松 男,1967年11月生于安徽省南陵县, 主要从事模式识别与机器学习方面的研究工作.
王煦法 男,1948年11月生于江苏省丹阳市, 中国科学技术大学计算机科学与技术系博士生导师, 主要从事计算机和智能处理方面的研究工作.