基于贝叶斯算法的图像分类系统设计_席伟
第8卷第Knowledge 28期(2012年10月) 电脑知识与技术Computer and Technology Vol.8, No.28, October 2012. ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术http://www.dnzs.net.cnE-mail:[email protected]
Tel:+86-551-[1**********]964
基于贝叶斯算法的图像分类系统设计
席伟
(沈阳化工大学计算机学院,辽宁沈阳110142)
摘要:图像分类是信息处理的重要研究方向,其中涉及了包括有图像特征提取、建立图像数据决策表,选取适当模式识别算法实现图像的分类。该文选取了模式识别常用的基于最小错误概率的贝叶斯算法,实现了对两类图像的分类问题。利用MATLAB 图形用户界面(GUI )方法,设计了良好的人机交互系统的主界面,最后给出了实际例子的程序运行结果,对推动模式识别理论在图像分类问题实践中的应用和普及,具有实际意义。
关键词:图像数据决策表;贝叶斯算法;MATLAB GUI ;图像分类
中图分类号:TP391文献标识码:A 文章编号:1009-3044(2012)28-6779-03
The Image Classification System Based on the Bayesian Algorithm
XI Wei
(ShenyangInstitute of Chemical Technology,Shenyang 110142,China) Abstract:Image classification is an important research direction of information processing, which involves a include image fea⁃ture extraction, to establish the image data decision table, select the appropriate pattern recognition algorithm for image classifica⁃tion. This paper selects the commonly used pattern recognition based on the minimum probability of error of the Bias algorithm, based on two kinds of image classification problems. Using the MATLAB graphical user interface (GUI ) design method, a good human-computer interaction system main interface, finally gives the practical examples of the program running results, to pro⁃mote the theory of pattern recognition in image classification application and popularization, has practical significance.
Key words:Image data decision table; Bayesian algorithm; MATLAB GUI; image classification
图像分类是一个具有重要应用价值的研究课题。目前,关于图像分类的研究主要集中在图像特征的提取和图像分类器的研究。在准确提取图像特征的基础上,如何有效的对图像进行分类,关键在于分类系统的设计。分类系统设计的主要问题在于分类器的设计和特征量的选择。贝叶斯分类是一种典型的分类器,本文在贝叶斯算法的基础上实现了对两类图像的分类器设计。MATLAB 是高效的数值计算的可视化科技应用软件和编程语言之一。图形用户界面(GraphicalUser Interfaces,GUI) 是提供人机交互的工具和方法。MALAB 图形用户界面开发环境(GraphicalUser Interfaces Developmen Envronment ,简称GUIDE) 提供了一系列创建用户图形界面(GUI)的工具。这些工具极大的简化了GUI 设计和生成的过程。
1贝叶斯算法简介
模式识别分类问题是对待识别的对象提取观测值,然后根据观测值进行分类。首先建立识别对象的训练集,其中每点的类别已知,根据这些条件,建立判别函数,通过现有的样品估计判别函数中的参数,然后用此判别函数去对类别未知的样品进行判定。
1.1贝叶斯法则
贝叶斯法则是对主观判断的一种修正方法,是指当样本足够多时,样本概率与总体概率近似。一般情况下,事件A 在事件B 的条件下的概率,与事件B 在事件A 条件下的概率不相等,然而,这两者是有确定关系的,贝叶斯法则就是这种关系的描述。
1.2贝叶斯决策
贝叶斯法则只是一种方法,是从大的方向上讲,要将它细化又可以分为许多的具体实施的决策。如果统计知识完整,贝叶斯决策理论是一种最优分类器。贝叶斯分类器是分类错误概率最小或者是平均风险最小的分类器。其设计方法属于一种基本的统计分类方法。
1.3基于最小错误概率的贝叶斯决策
一X ,判断X 的类别。由贝叶斯公式可知若每个样品属于ω1, ω2类中的一类,已知两类的先验概率分别为P (ω1), P (ω2) ,两类的类别密度函数为P (X |ω1), P (X |ω2) 。则任给
收稿日期:2012-08-25
本栏目责任编辑:唐一东人工智能及识别技术6779
Computer Knowledge and Technology 电脑知识与技术第8卷第28期(2012年10月)
P (ωj |Χ)=P (X ωj ) P (ωj )/P (X ) ,|
由全概率公式可知
P (X ) =∑P (X |ωj ) P (ωj ) ,M
j =1
2图像分类识别系统实现
2.1HSV 颜色空间P (X ) =P (X |ω1) P (ω1) +P (X |ω2) P (ω2) ,其中M 为类别数。对于两类问题,所以用后验概率来判别P (ω1|X ) >P (ω2|X ) ⇒X ∈ω1P (ω1|X )
HSV 颜色空间比较其它的颜色空间更适合人的视觉特性。其中包含色调H(Hue)、饱和度S(Saturation)和亮度V(Value)。色调H 表示表示光的颜色,饱和度S 表示光的浓度,亮度V 表示光的明暗程度。在基于内容的图像检索中,应用这种颜色空间模型会更适合用户的视觉判断。
2.2颜色空间的量化
根据人的视觉分辨能力的分析,颜色大致划分为如下9种:红、黄、绿、青、蓝、紫、黑、灰和白,依据这九种颜色就可以大致描述一幅图像。因此,可以根据这九种颜色来大致确定图像的主颜色特征。具体量化方法可见文献[5]。
2.3分块主色的实现
本文对图像二维空间进行4*4的划分。对其中每一个分块,统计出像素最多的那种颜色作为主色,建立图像的颜色特征向量。分块主色法是统计图像每个分块主色来突出颜色的空间关系,适用于主题位置相对固定的分类问题,对于变化较大的图像效果会明显减弱。
2.4主要MATLAB 程序
函数名:bayesleasterror()
参数:sample :待识别图像特征
返回值:y :待识别图像所属类别
函数功能:最小错误概率的贝叶斯分类器function y=bayesleasterror(sample)clc;load templet pattern; %对图像库和待测图像进行主成分分析[pcapat,pcasamp]=pcapro(sample);temp=0;for i=1:2pattern(i).feature=pcapat(:,temp+1:temp+pattern(i).num);temp=temp+pattern(i).num;end s_cov=[];s_inv=[];s_det=[];for i=1:2s_cov(i).dat=cov(pattern(i).feature');%求个类别的协方差矩阵s_inv(i).dat=inv(s_cov(i).dat);%求协方差矩阵的逆矩阵_s_det(i)=det(s_cov(i).dat);%求协方差矩阵的行列式end sum1=0;p=[];for i=1:2sum1=sum1+pattern(i).num;%求图像库样品总数end for i=1:2p(i)=pattern(i).num/sum1;%求类别的先验概率end h=[];mean_sap=[];for i=1:2mean_sap(i).dat=mean(pattern(i).feature')';%求每类图像的特征值end 6780人工智能及识别技术本栏目责任编辑:唐一东
第8卷第28期(2012年10月) Computer Knowledge and Technology 电脑知识与技术3图形用户界面%计算最大的判别函数for i=1:2h(i)=(pcasamp-mean_sap(i).dat)'*s_inv(i).dat*(pcasamp-mean_sap(i).dat)*(-0.5)+log(p(i))+log(abs(s_det(i)))*(-0.5);end [maxvalmaxpos]=max(h);y=maxpos;
利用MATLAB 程序特点进行模式识别算法编程减少了编程的工作量,对于一个成功的软件来说,其内容固然应该是第一位的,但除此之外,图形界面的优劣往往也决定着该软件的档次。MATLAB 图形用户界面的优点是工具箱形象直观,利用其自身的GUIDE 功能来完成界面结构的设计。图像识别系统的界面程序主要内容就是每个控件的回调函数,利用回调函数,把功能分散的模式识别函数整合在如图1的主界面中,下面以控件“载入图像”为例,给出回调函数Callback 的语句function pushbutton1_Callback(hObject,eventdata, handles) global sample [fnamepname index]=uigetfile({'*.jpg'},'');if index str=[pnamefname];c=imread(str);axes(handles.axes1)image(c);axisoff end C.rgb=c;aa=fenge(C.rgb);for j=1:16tt(j)=color(aa(j));j=j+1;end C.zs=tt;sample=tt;在MATLAB 提示符下键入识别系统名“txsb3”命令则启动如图1所示的识别系统主界面,用户可由其中的载入图像按钮载入需要识别的图像,在菜单栏中选取相应的识别算法,系统就可在相应位置显示图像的类别,主颜色矩阵,
分类时间等信息。
图1图像分类识别系统主界面
4总结
本文介绍了如何利用MATLAB 软件及图形用户界面开发和设计图像分类系统的方法和步骤,图像分类是信息处理的重要研究方向,其中涉及了包括有图像特征提取、建立图像数据决策表,选取适当模式识别算法实现图像的分类。本文选取了模式识别常用的基于最小错误概率的贝叶斯算法,实现了对两类图像的分类问题。利用MATLAB 图形用户界面(GUI )方法,设计了良好的人机交互系统的主界面,最后给出了实际例子的程序运行结果,对推动模式识别理论在图像分类问题实践中的应用和普及,具有实际意义。
软件菜单中的算法还不完善,系统的性能还需要进一步提高,以满足多类图像的识别问题,进一步工作包括增加聚类分析等算法,实现对三类及多类的图像识别问题。
参考文献:
[1][2][3][4][5]杨淑莹. 模式识别与智能计算—MALAB 技术实现[M].北京:电子工业出版社,2008:67-78. 高成, 李淑红.MATLAB 图像处理与应用[M].北京:国防工业出版社,2006:32-45. 吴成玉, 邰晓英, 赵杰煜. 基于颜色特征的图像检索[J].计算机应用,2004,(24):135-137.余芳. 基于颜色特征的图像检索技术研究. 硕士学位论文. 中国石油大学,2007. 徐择峰, 陈世鸿. 一种统一的文本与图像分类算法[J].武汉大学学报:理学版,2004,50(1):79-82.人工智能及识别技术本栏目责任编辑:唐一东6781