数字图像的纹理特征提取与分类研究_苏杰
第31卷
数字图像的纹理特征提取与分类研究
苏 杰1, 2 王丙勤1 郭 立1
(1. 中国科学技术大学电子科学与技术系 合肥 230027; 2. 武警石家庄指挥学院通信基础教研室 石家庄 050000)
摘 要:本文提出了一种基于Gabor 小波和灰度共生矩阵进行数字图像特征提并与支持向量机模型相结合的纹理分类算法。首先分别利用Gabor 变换和灰度共生矩阵提取数字图像的特征, 进而利用支持向量机算法实现图像的训练和分类。实验结果表明, 与传统的分类方法相比, 这种通过G abo r 小波和灰度共生矩阵得到数字图像的特征并与支持向量机相结合的方法能有效地提高分类正确率。
关键词:数字图象; 纹理特性; Gabor 小波; 灰度共生矩阵; 支持向量机; 特征提取中图分类号:T N 911. 73 文献标识码:A
Textural feature extraction and classification study research of digital image
Su Jie 1, 2 W ang Bingqin 1 G uo L i 1
(1. Department of Electr onic S cience and Technology, University of Science and T ech nology, H efei 230027;
2. Departmen t of Commu nication s In frastructu re, Shijiazh uan g Command College
of the Chin ese People s Arm ed Police Forces, Shijiazhu ang 050000)
Abstract:T his paper presents a tex ture classification alg or ithm using Gabo r w avelet and G ray Level Co o ccurr ence M atr ix as feature ex traction met ho d and Suppo rt Vector M achine as classifier. F irst, G abo r transfor m and Gr ay Lev el Co Occurr ence M atr ix a re used to g et the featur es o f the dig ital imag es, and then SV M classif iers are fo llowed to build imag e and realize classification. T he ex per imental results hav e show n that the metho ds described in this paper can be mor e effectiv ely impro ve the rate of co rr ect classification than the t raditio nal metho d o f classification.
Keywords:digit al imag e; t ex tr ue featrue; Gabo r wav elet; g ray level co o ccur rence matr ix ; support v ecto r machine; featur e extr action
0 引 言
在当今数字时代, 数字图像可以通过极易获得的数字图像处理工具得到。在很多情况下, 人们必须分辨出哪些是真实照片, 哪些是经过计算机处理的或是人为合成的。在司法体系中, 伪造的照片可能让无辜者蒙冤, 有罪者逍遥法外; 在保险索赔时, 合成照片若被当成证据, 就会使保险公司蒙受损失; 图像的真实性对于新闻出版业也是个严峻的问题。对图像内容的辨别就决定了图像的来源与内在权威性。数字图像真伪分析技术的研究对于传媒、司法、国家安全等领域, 都有着重要的意义, 其应用非常广泛。
纹理是图像的灰度统计信息、空间分布信息和结构信息的综合反映。它是由象素组成的具有一定形状和大小的集合, 是几乎所有图像表面都固有的特性。纹理特征的提取指的是通过一定的图像处理技术检测出纹理基元, 建
立模型, 从而获得纹理定量或定性描述的过程。目前已有许多纹理提取方法, 例如:统计法、结构法以及频谱法[1]。灰度共生矩阵是统计法的一种, 能够很好的反映象素之间的灰度级空间相关的规律, 但是缺少与人的视觉的相似性。Gabor 小波变换方法是频谱法的一种。因为粗纹理空间能量集中在低频部分, 而细纹理空间能量集中在高频部分, 因此功率谱和能量可作为描述纹理的一种测度。本文考虑将这2种方法结合起来, 提取出计算机绘制的人物图像(以下简称CG 图像) 和数码相机拍摄到的真实人物图像(以下简称PG 图像) 的纹理特征, 从而利用支持向量机进行分类辨别。事实证明这种方法很有效。
由于在前面的工作中, 已经建立了具有一定数量的包含人物图像的数字图像集, 因此本文的实验与讨论都是基于此图像集的基础上的。
第5期
1 图像纹理特征提取
1. 1 图像的G abor 小波特征提取
Gabor 小波是纹理提取方法的一种, 它能够针对人的视觉更加有效的刻画出纹理的特性, 因而在图像处理方面得到了广泛的应用[2 3]。
一个二维Gabor 小波的基函数可以定义为:g(x,y) =exp[-(2+2) +2 j x ](1)
2 2x y x y
式中:g (x, y ) 是经过复数正弦函数调制的Gauss ian 函数, x , y 分别为Gabor 小波基函数沿x 轴和y 轴方向的方差, 为中心频率。这里Gabor 小波基函数是以( , 0) 为中心频率的带通滤波器。通过对Gabor 小波基函数g (x, y ) 进行尺度伸缩和旋转形成Gabor 小波族:
-m
g m n (x, y) =a g (x y ) , a >1, m , n Z (2)
-m -m
式中:x =a (x cos +y sin ) , y =a (-c os +y sin ), =n /k , k 是方向数, a -m 是尺度因子。
实验中采用5个尺度4个方向(0 , 45 , 90 , 135 ) 的Gabor 滤波器, 将输入纹理图像与Gabor 小波进行卷积可得到不同方向和尺度的子带。设输入纹理图像为I(x, y) , 则经Gabor 分解输出的图像:
I m n (x, y) =I(x, y) g m n (x, y) (3) 设 I m n (x,y) 的大小为M N , 计算其绝对值的均值和方差组成1 40维的特征向量V =[ m n , mn ]。
mn =
x =1y=1
(1) 最大概率:
max (c ij ) i, j
(2) 元素差异的k 阶矩:
(7)
k
(i -i
j
j ) c ij
k
(8)
(3) 你元素差异的k 阶矩:
c
i
j
ij
/(i -j ) , i j (9)
22
(4) 一致性:
c
i
j
2
ij
(10)
(5) 熵:-
c
i
j
ij
log 2c ij (11)
2 支持向量机(SVM)
支持向量机(S VM ) 方法是从线性可分情况下的最优分类超平面(
opt imal hyperplane) 发展而来的。所谓最优分类超平面就是要求分类面不但能将两类正确分开(训练错误率为0) , 而且使分类间隔最大。分类间隔(margin) 定义为两类距离超平面最近的点到超平面的距离之和。使分类间隔最大, 实际上是对推广能力的控制。分类间隔越大, 则推广能力越好, 这是SVM 的核心思想之一[6 8]。
M N
I m n (x, y )
(4)
M N
=1y =1
(5)
M N
1. 2 图像的灰度共生矩阵(GLCM)特征提取
除了以上的对于图像的Gabor 小波特征进行的特征提取, 还对图像的灰度共生矩阵特征进行了提取, 以期望能够对分类的准确率有所帮助。
[4 5]
灰度共生矩阵(记为W 阵) 是统计空间上具有某种位置关系的一对像元灰度对出现的频度。其实质是从图像灰度为i 的像元(位置为x , y ) 出发, 统计与其距离为d , 灰度为j 的像元(x +D x , Y +D y ) 同时出现的频度c(i, j , d , ) 。数学表达式为:
c(i, j , d , ) ={[(x , y) , (x +D x , y +D y ) |f (x, y ) =i; f (x +D x , y +D y ) =j ]}(6) 式中:x , y =0, 1, 2, , N -1是图像的像元坐标; i, j =0, 1, , L -1是灰度级; D x , D y 是位置偏移量。d 为W 阵的生成步长; 为W 阵的生成方向, 取0 、45 、90 、135 4个方向。归一化后各点频度值为c(i, j ) =C(i, j ) /R , R 是归一化常数。
针对其不同的生成方向, 可以分别求得如下特征值作为统计特征进行测试。
mn =
(
2
I m n (x, y) - mn )
图1 分类超平面
对于非线性情况下的判决边界问题, 可以通过某种非线性的特征变换, 将原始特征空间中的非线性问题变换为一个高维空间中的线性问题, 从而在这个高维空间中构造广义最优超平面, 得到原始特征空间中非线性问题在变换后的高维空间中的线性解。而在这个过程中, 如何变换、变换到哪个空间, 都是由核函数K (x i , x j ) = (x i ) (x j )
T
决定的, (x) 就是相应的核函数映射。
对两类样本数据(x i , y i ) , x i R , y i {+1, -1}, i =1, , n , 引入核函数后, 相应的分类函数也变为:f (x) =sgn {(w x) +b}=sgn {
i =1n
d
y K (x , x) +
i
i
i
b}(12)
式中: i 是下列函数的解:
第31卷
最大值:Q( ) =
i =1
n
i -2
i , j =1
i
n
j y i y j (xi x j )
(13)
像素, 其中包括450幅用图像软件制作的人物图像和450幅数码相机拍摄的人物照片。从中选取400幅人工图像和400幅人物照片作为训练集, 分别余下50幅图像作为测试集。
约束条件:
y =
i i
i =1
n
0和0 i C i =1, , n (14)
在对图像的Gabor 小波特征提取时, 从每幅图像可以得到一个1 40维的特征向量; 在对图像的灰度共生矩阵特征进行提取时, 从每幅图像可以得到一个1 20维的特征向量。通过将特征值作为输入值, 代入支持向量机, 选择适当的核函数, 即可完成训练、分类。在核函数的选取中, 分别选取Linear(线性) 核函数、Poly(多项式) 核函数、Rbf(径向基) 核函数、Erbf(指数径向基) 核函数、Spline(样条) 核函数以及Sigmoid(sigmoid 型) 函数来进行测试。
在实验中, 首先把Gabor 小波特征单独作为输入变量, 代入支持向量机进行训练以及分类。分类结果如表1所示。
C(C>0) 是错误惩罚因子, 用来控制样本错误分类数与最大分类间隔之间的平衡。这就是支持向量机, 其中核函数起着极其重要的作用。目前, 常用的核函数类型包括线性核函数、多项式核函数、RBF(径向基) 核函数、Sigmoid 核函数等。
3 分类器的训练、测试及结果分析
在开始进行分类器的训练之前, 首先构造一个包含900幅bmp 格式的彩色图片库, 图片大小统一为256 256
表1 Gabor 小波特征的分类结果
SV M 函数选择CG 分类准确率(%)PG 分类准确率(%)
L inea r 9480
Po ly 9480
R bf 9884
Erbf 9484
Spline 9478
Sig moid 9080
表2 Gabor 小波特征与Gabor 小波与灰度共生矩阵特征合并输入的分类结果比较输入变量分类错误CG 样本分类错误PG 样本CG 分类准确率(%) P G 分类准确率(%)
G abo r 小波
49 8 98 84
表3 不同特征输入的分类结论可信度比较
输入变量分类准确率(%)PG 分类准确率(%) 结论为CG 的可信度(%)结论为PG 的可信度(%)
G abo r 小波
98 84 85. 96 97. 67
Gabor 小波特征和GLCM CG
98 90 90. 74 97. 82
Gabor 小波特征和GLCM
49 5 98 90
通过分类结果可以看到, 利用不同的核函数进行分类
的分类结果变化不大, CG 图像的分类准确率维持在90%到98%之间, 相差4幅图像; PG 图像的分类准确率维持在78%到84%之间, 相差3幅图像。其中, 利用径向基核函数对PG 图像和CG 图像分类取得的效果是最好的。另外, CG 图像的分类准确率普遍好于PG 图像的分类准确率, 普遍相差10%左右。
接下来, 把Gabor 小波特征和灰度共生矩阵特征一起作为输入变量, 代入支持向量机进行训练分类。在这次支持向量机的使用中, 由于上一次的经验, 选择Rbf (径向基) 核函数来检验分类效果, 其分类结果与Gabor 小波特征单独作为输入变量的分类结果如表2所示。
通过分类结果的比较, 很明显地可以看到加入灰度共生矩阵特征后, CG 图像的分类准确率没有变化, PG 图像
的分类准确率提升了6%,即多分辨正确了3幅图像。从这一点可以说明灰度共生矩阵特征的加入对于图像分类准确率的提升起到了促进的作用。
接下来就其可信度的问题进行简单的讨论。假设在实际中, 获得一幅未知图像, 想要通过这个系统判断出其类别。得到的结论也许是CG 图像, 也许是PG 图像, 这就涉及到了结论的可信度问题。在下面的表3中, 将利用概率的方法, 分别根据表2的2种不同输入变量下, 支持向量机分类准确率计算出其可信度。
从表3可以看到:与一般印象不同的是, CG 图像的分类准确率高, 但是它所导致的是如果结论中对一幅图像的判定为PG 图像反而比判定一幅图像为CG 图像的可信度要高一些; 另外, PG 图像的分类准确率的提高, 对于提高判定CG 图像的可信度同样有所帮助。有一点可以肯定的是分类准确率的整体水平的提高, 会带来可信度的提升。
[5]
第5期
[6]
[7] [8]
LIU Z G, ZH AN G Y J. Image ret rieval using both color and text ure features [J]. Journal of Ch ina Instit ute of Com munications, 1999, 20(5) :36 40. LU ENBERGER D G. Linear and nonlinear program ming [M ].A ddison Wesley Publishing Company, 1984.
边肇祺, 张学工. 模式识别[M ]. 2版. 北京:清华大学出版社, 2000:296 304.
LYU S, FARID H. H ow realistic is photo realist ic [J ].IEEE Transac t ions on signal processing, 2005, 53(2) .
葛海峰, 林继鹏, 刘君华, 等. 基于支持向量机和小波分解的气体识别研究[J]
. 仪器仪表学报, 2006, 27(6) :573 578.
作者简介
[9]
4 结 论
本文提出了一种基于图像Gabor 小波特征与灰度共生矩阵特征结合通过支持向量机进行训练、分类从而实现对图像真伪进行辨别的方法。Gabor 小波是纹理特征提取的重要方法, 能够捕获纹理中的较多有用信息, 准确度高, 辅以灰度共生矩阵特征一起作为图像特征信息更增强了图像分类的准确性。这种方法具有一定的实际应用价值。需要指出的是:当图像的分辨率变化时, 计算出的纹理会有较大的偏差, 本文中的实验都是在256 256的人物图像库中进行的; 另外, 由于实际中遇到的人物图像可能是复杂多样的以及图像库的容量有限(共有900幅图像) , 这种方法在实际应用中的具体效果还需要进一步检验。在实际应用中, 应当尽量综合利用图像的纹理、颜色等特征, 提高图像真伪分析准确性。
参考文献
苏杰, 男, 1978年出生, 中国科学技术大学硕士研究生, 电子科学与技术系电路与系统专业, 研究方向为数字图像处理。E m ail:sj780126@mail. ustc. edu. cn,
王丙勤, 男, 1981年出生, 研究生, 主要
研究方向为计算机图形图像处理、集成电路与设计。
[1] [2]
章毓晋. 基于内容的视觉信息检索[M ].北京:科学出版社, 2003.
盛文, 杨江平, 柳健, 等. 一种基于纹理元灰度模式统计的图像纹理分析方法[J]. 电子学报, 2000, 28(4) :73 75.
M ANJU NAT H B S, M AW Y. T exture features for brow sing and retrieval of im age Data[J]. IEEE T ransactions on Pat tern Analysis And M achine Int elligence, 1996, 8(18) :837 842.
FURH T B, SMOLIA R S W, ZH ANG H L, et al . Video and image processing in multim edia system s [M]. Boston:Kluw er A cademic Publishers, 1995:226 270.
郭立, 男, 1946年出生, 教授, 博士生导师, 研究方向为集成电路与系统、片上系统设计和数字图像处理。
[3]
[4]