模式识别理论及其应用综述
模式识别理论及其应用综述
熊超 浙江理工大学公共计算机教学部
学工作者近几十年来的努力,已经取得了系统的研究成果。
1.2模式识别的方法
现在有两种基本的模式识别方法,即统计模式识别方法和结构(句法)模式识别方法。统计模式识别是对模式的统计分类方法,即结合统计概率论的贝叶斯决策系统进行模式识别的技术,又称为决策理论识别方法。利用模式与子模式分层结构的树状信息所完成的模式识别工作,就是结构模式识别或句法模式识别。
1.3模式识别系统
不论是以哪种模式识别方法为基础的模式识别系统,基本上都是由两个过程组成的,即设计与实现。设计是指用一定数量的样本(叫做训练集或学习集)进行分类器的设计。实现是指用所设计的分类器对待识别的样本进行分类决策。基于统计方法的模式识别系统如图所示:
1.4 统计模式识别
(标签训练样本)对非监督学习(未标签训练样本);监督学习和非监督学习又可分为参数估计和非参数估计。
统计模式识别的主要方法有:判别函数法,k近邻分类法,非线性映射法,特征分析法,主因子分析法等。
在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(训练样本)学习,是更简便有效的方法,因而获得了广泛的应用,但它是一种启发式技术,缺乏指定工程实践的坚实理论基础。统计推断理论研究所取得的突破性成果导致现代统计学习理论——VC理论的建立,该理论不仅在严格的数学基础上圆满地回答了人工神经网络中出现的理论问题,而且导出了一种新的学习方法——支撑向量机。
前言
狗的嗅觉的灵敏度非常高,大约是人的50至100倍。狗通过这项特异的功能来识别各种各样的东西,帮助人类完成一些鉴别工作。不仅如此,识别也是人类的一项基本技能,人们无时无处的在进行“模式识别”,古人有一成语“察言观色”表达的正是这个意思。随着第一台计算机ENIAC的出现以及人工智能的兴起,人们自然而然的把目光投向如何将人类的识别能力成为计算机的一部分功能,从而减轻人类自身的脑力劳动。计算机模式识别在20世纪60年代初迅速发展并成为一门新学科。
2,模式识别的应用
经过多年的研究和发展,模式识别技术已广泛被应用于人工智能、计算机工程、机器学、神经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和武器技术等许多重要领域,如语音识别、语音翻译、人脸识别、指纹识别、手写体字符的识别、工业故障检测、精确制导等。模式识别技术的快速发展和应用大大促进了国民经济建设和国防科技现代化建设。
2.1 字符识别
字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉
字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。
汉字是历史悠久的中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。汉字数量众多,仅清朝编纂的《康熙字典》就包含了49,000多个汉字,其数量之大,构思之精,为世界文明史所仅有。由于汉字为非字母化、非拼音化的文字,所以在信息技术及计算机技术日益普及的今天,如何将汉字方便、快速地输入到计算机中已成为关系到计算机技术能否在我国真正普及的关键问题。目前,汉字输入主要分为
1,模式识别与统计模式识别
1.1 模式与模式识别的概念
广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式;狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)。
模式识别则是在某些一定量度或观测基础上把待识模式划分到各自的模式类中去。计算机模式识别就是是指利用计算机等装置对物体、图像、图形、语音、字形等信息进行自动识别。
模式识别的研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家、神经生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科
在统计模式识别中,一个模式表示为一组d个特征或属性,称为d维特征矢量。识别系统运行有两种模式:训练和分类。在训练模式中,预处理模块将感兴趣的特征从背景中分割出来,去除噪声,归一化模型,以及其它限定模式在紧支区间表示的操作;特征提取,选择模块找到合适的特征来表示输入模式;分类器被训练分割特征空间。在分类模式中,被训练的分类器根据测量的特征将输入模式分配到某个模式类。
统计模式识别的决策过程可以总结如下:根据一个d维特征矢量,将一个给定模式分配到c类中的某一个。如果待分类样本的类条件密度已知,则可以通过贝叶斯决策理论来对样本进行分类;如果样本的类条件密度未知,则又根据训练样本的类别是否已知可以将分类问题二分为监督学习
人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了连机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。
2.2 语音识别
语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术。该方法在语音识别时识别速度较快,也有较高的识别率。
2.3 指纹识别
我们手掌及其手指、脚、脚趾内侧表面的皮肤凹凸不平产生的纹路会形成各种各样的图案。而这些皮肤的纹路在图案、断点和交叉点上各不相同,是唯一的。依靠这种唯一性,就可以将一个人同他的指纹对应起来,通过比较他的指纹和预先保存的指纹进行比较,便可以验证他的真实身份。一般的指纹5个大的类别:左旋型(leftloop),右旋型(right loop),双旋型(twinloop),螺旋型(whorl),弓型(arch)和帐型(tented arch),这样就可以将每个人的指纹分别归类,进行检索。指纹实现的方法有很多,大致可以分为4类:基于神经网络的方法、基于奇异点的方法、语法分析的方法和其他的方法。在指纹识别的应用中,一对一的指纹鉴别已经获得较大的成功,但一对多的指纹识别,还存在着比对时间较长,正确率不高的特点。为了加快指纹识别的速度,无论是对简化图像的预处理,还是对算法的改进,都刻不容缓。
2.4细胞识别
细胞识别是最近在识别技术中比较热门的一个话题。以前,对疾病的诊断仅仅通过表面现象,经验在诊断中起到了主导作用,错判率始终占有一定的比例;而今,通过对显微细胞图像的研究和分析来诊断疾病,不仅可以了解疾病的病因、研究医疗方案,还可以观测医疗疗效。如果通过人工辨识显微细胞诊断疾病也得不偿失,费力费时不说,还容易耽误治疗。基于图像区域特征,利用计算机技术对显微细胞图像进行自动识
别愈来愈受到大家的关注,并且现在也获得了不错的效果。但实际中,细胞的组成是复杂的,应该选择更多的特征,建立更为完善的判别函数,可能会进一步提高分类精度。
但必须培养学生应用计算机完成专业相关的能力,以便他在择业和就业后能够很快地适应现代化的工作条件,保证他能提交合格专业的成果。只有这样,我们培养的学生才能够受到企业、事业部门的认可,我们的学生才有竞争实力,才能在人才市场利于不败之地。
3,模式识别技术的发展趋势
3.1语音识别技术
语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。
3.2生物认证技术
生物认证技术是本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。在银行里,人们只需伸出手指放在识别仪上就可以存取现金将指日可待。国际数据集团(IDC)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100美元的市场规模。
3.3数字水印技术
90年代以来才在国际上开始发展起来的数字水印技术是最具发展潜力与优势的数字媒体版权保护技术。IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。
2.注意思想引导,做好良师益友
在国外,如果有工作,但因为工资不理想,地点不理想,或是工作不理想而不去就业,就不能算作失业,而称之为“自愿失业”。在我们国家,没有找到工作的大学生中恐怕有不少是属于这种情况。当然,作为大学毕业生,想找好一些、收入高一些的工作是可以理解的,但对不切实际的高要求,可能只能算入“自愿失业”中去。在一个双向选择的人才市场中,一切选择行为都变得越来越理性。大学生扩招,导致毕业生的供给增加,应届毕业生整体的薪酬水平大幅度下降也成了理所当然的事情。问题在于,社会、家长和大学生自身并没有完全接受这个现实。知名企业吉百利公司中国区人力资源总监曹渊勇特别强调对大学生的沟通,“我们发现,对大学生来说,最难做到的就是树立正确的自我意识。”作为专业课教师,应该针对大学生的就业观给予必要的指导和及时的指正,可以通过课堂专业知识讲授,展开讨论本专业的就业前景,理清学生头脑中对就业的混沌状态,使他们明确本行业的动态及自己的实际状态,打消各种不切实际的想法,帮助学生树立吃苦耐劳的观念,培养学生脚踏实地工作作风,坚定其对美好未来的信心。
综上,更好的发挥专业课教师的教学职能,将有助于提高大学生的综合职业能力,有效地指导大学生就业,提高应届生的就业率,为更多企、事业单位输送优秀的人才,从而改善、提高我国的人才合理利用率,推动我国国民经济建设进程。
4,结束语
模式识别是一个快速发展和扩散的学科,其在国民经济和国防现代化建设中具有广阔的应用领域和应用前景。随着模式识别理论和技术的发展,其应用领域和实际应用需求也将不断增长。