隐马尔可夫模型

05-28

语音识别系统的声学建模：隐马尔可夫模型（HMM）

语音识别系统的模型通常由声学模型和语言模型两部分组成，分别对应于语音到音节概率的计算和音节到字概率的计算。我们将在这里介绍语音识别系统基于隐马尔可夫模型的声学建模。

隐马尔可夫模型是马尔可夫链的一种，作为一种统计分析模型，它的状态不能直接观察到，但能通过观测向量序列观察到，每个观测向量都是通过某些概率密度分布表现为各种状态，每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以，隐马尔可夫模型是一个双重随机过程，即具有一定状态数的隐马尔可夫链和显示随机函数集。

隐马尔可夫模型（HMM）作为一种统计分析模型创立于20世纪70年代。80年代得到了传播和发展，成为信号处理的一个重要方向，现已成功地用于语音识别，行为识别，文字识别以及故障诊断等领域。

隐马尔可夫模型是马尔可夫链的一种，它的状态不能直接观察到，但能通过观测向量序列观察到，每个观测向量都是通过某些概率密度分布表现为各种状态，每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以，隐马尔可夫模型是一个双重随机过程----具有一定状态数的隐马尔可夫链和显示随机函数集。自20世纪80年代以来，HMM被应用于语音识别，取得重大成功。到了90年代，HMM还被引入计算机文字识别和移动通信领域。

对语音识别系统，输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设，一是内部状态的转移只与上一状态有关，另一是输出值只与当前状态（或当前的状态转移）有关，这两个假设大大降低了模型的复杂度。

一、声学建模

语音识别系统中使用隐马尔可夫模型（HMM）通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模，一个音素就是一个三至五状态的HMM，一个词就是构成词的多个音素的HMM串行起来构成的HMM，而连续语音识别的整个模型就是词和静音组合起来的HMM。

上下文相关建模即协同发音，指的是一个音受前后相邻音的影响而发生变化，从发声机理上看就是人的发声器官在一个音转向另一个音时其特性只能渐变，从而使得后一个音的频谱与其他条件下的频谱产生差异。上下文相关建模方法在建模时考虑了这一影响，从而使模型能更准确地描述语音，只考虑前一音的影响的称为Bi- Phone，考虑前一音和后一音的影响的称为Tri-Phone。

英语的上下文相关建模通常以音素为基元，由于有些音素对其后音素的影响是相似的，因而可以通过音素解码状态的聚类进行模型参数的共享。聚类的结果称为senone。决策树用来实现高效的triphone对senone的对应，通过回答一

系列前后音所属类别（元/辅音、清/浊音等等）的问题，最终确定其HMM状态应使用哪个senone。分类回归树CART模型用以进行词到音素的发音标注。

二、HMM模型的表达

隐马尔可夫模型（HMM）可以用五个元素来描述，包括2个状态集合和3个概率矩阵：

1. 隐含状态 S

这些状态之间满足马尔可夫性质，是马尔可夫模型中实际所隐含的状态。这些状态通常无法通过直接观测而得到。（例如S1、S2、S3等等)

2. 可观测状态 O

在模型中与隐含状态相关联，可通过直接观测而得到。(例如O1、O2、O3等等，可观测状态的数目不一定要和隐含状态的数目一致。）

3. 初始状态概率矩阵 π

表示隐含状态在初始时刻t=1的概率矩阵，(例如t=1时，P(S1)=p1、P(S2)=P2、P(S3)=p3，则初始状态概率矩阵 π=[ p1 p2 p3 ].

4. 隐含状态转移概率矩阵 A

描述了HMM模型中各个状态之间的转移概率。其中Aij = P( Sj |

Si ),1≤i ,j≤N.表示在 t 时刻、状态为 Si 的条件下，在 t+1 时刻状态是 Sj 的概率。

5. 观测状态转移概率矩阵 B

令N代表隐含状态数目，M代表可观测状态数目，则：

Bij = P( Oi | Sj ), 1≤i≤M,1≤j≤N.

表示在 t 时刻、隐含状态是 Sj 条件下，观察状态为 Oi 的概率。

三、应用HMM通常解决的3类基本问题

1. 评估问题。

给定观测序列O=O1O2O3„Ot和模型参数λ=(A,B,π)，怎样有效计算某一观测序列的概率，进而可对该HMM做出相关评估。例如，已有一些模型参数各异的HMM，给定观测序列O=O1O2O3„Ot，我们想知道哪个HMM模型最可能生成该观测序列。通常我们利用forward算法分别计算每个HMM产生给定观测序列O的概率，然后从中选出最优的HMM模型。

这类评估的问题的一个经典例子是语音识别。在描述语言识别的隐马尔科夫模型中，每个单词生成一个对应的HMM，每个观测序列由一个单词的语音构成，单词的识别是通过评估进而选出最有可能产生观测序列所代表的读音的HMM而实现的。

2. 解码问题

给定观测序列O=O1O2O3„Ot和模型参数λ=(A,B,π)，怎样寻找某种意义上最优的隐状态序列。在这类问题中，我们感兴趣的是马尔科夫模型中隐含状态，这些状态不能直接观测但却更具有价值，通常利用Viterbi算法来寻找。

这类问题的一个实际例子是中文分词，即把一个句子如何划分其构成才合适。例如，句子“发展中国家”是划分成“发展-中-国家”，还是“发展-中国-家”。这个问题可以用隐马尔科夫模型来解决。句子的分词方法可以看成是隐含状态，而句子则可以看成是给定的可观测状态，从而通过建HMM来寻找出最可能正确的分词方法。

3. 学习问题。

即HMM的模型参数λ=(A,B,π)未知，如何调整这些参数以使观测序列O=O1O2O3„Ot的概率尽可能的大。通常使用Baum-Welch算法以及

ReversedViterbi算法解决。

四、基本算法

针对以上三个问题，人们提出了相应的算法

① 评估问题：向前向后算法

② 解码问题：Viterbi算法

③ 学习问题：Baum-Welch算法

一般的，可以用λ=(A,B,π)三元组来简洁的表示一个隐马尔可夫模型。隐马尔可夫模型实际上是标准马尔可夫模型的扩展，添加了可观测状态集合和这些状态与隐含状态之间的概率关系。

与《隐马尔可夫模型》相关的范文

08-14 德育中如何体现爱心

　　教师都有一颗爱生之心，但往往有些教师认为有好心没好报。那么教师怎样做才能把爱心体现出来呢？笔者认为应该从以下几方面着手：　　首先是尊重和信任学生。用一句学生常用的话，“老师应该对我们有礼貌，我们也是人。”这里的人，指的就是学生的人格。　　有一位教育学专家说过这样有意思的话：在今天中国的教室里，坐着的是学生，站着的是先生，而在精神上，这种局面恰恰打了个颠倒-站着的先生占据着至尊之位，而坐着的 ...

09-08 学习赞可夫心得体会

学习赞可夫《教学与发展》心得体会为了响应学校的号召-多读书，读好书，全员积极行动起来，建立书香校园，我于本期认认真真阅读了苏联的著名教育家赞可夫的经典论著《教学与发展》。众所周知，赞可夫伟大的成就就是，他打破了教学实践中只传授知识、技能和技巧相联系的陈旧模式，把教学同发展联系起来，建立了一套比较完整治的较新的教学体系，从而大大提高了学生掌握知识和技巧的能力，把教学推上了一个崭新的台阶，这是教学论 ...

06-12 2014年第二学期数学工作总结

这个学期我担任xxx班和xxx班的数学教学工作，转瞬间一个学期就要过去了，反观这个学期我走过的路，有许多的收获，也有不少的遗憾。由于我从教时间短，教学经验浅，又处在学生走入真正教育的初始阶段，深怕的自己的言谈举止，教育方法不当会影响学生对今后小学阶段数学学习的态度取向，所以我丝毫不敢懈怠，认真学习理论知识，深入研究教学，向有多年教学经验的老教师请教，半学期下来，自己感觉对教书育人也算是入了门。为了 ...

09-30 修养-名人名言

1、道德之所以有如此崇高和美好的名声，就是因为它总是伴随着巨大的牺牲。-康德 2、当我们的人格降低时，我们的趣味也跟着下降。-柯罗连科 3、吾日三省吾身：为人谋(事)而不忠乎？与友交而不信(诚实)乎？传(老师传授的道理)不习乎？-孔丘 4、礼貌是一种回收有礼貌的尊重的愿望。-拉罗什富科 5、青春啊！永远是美好的，可是真正的青春，只属于这些永远力争上游的人，永远忘我劳动的人，永远谦虚的人！-雷锋 6 ...

10-23 读书方案

《爱的教育》读书方案读本的内容《爱的教育》是一个意大利四年级小学生在一个学年十个月中所记的日记。全书共一百篇文章，主要由三部分构成：主人公的日记；他的父母在他日记本上写的劝戒启发性的文章；以及十则老师在课堂上宣读的小故事。《爱的教育》这本风行全球、脍炙人口的著作，由意大利作家亚米契斯耗时近十年完成。无论哪一章，哪一节，都把“爱”表现得精髓深入，淋漓尽致，大至国家、社会、民族的大我之爱，小至父 ...

05-09 爱国-名人名言

　　惟有民魂是值得宝贵的，惟有他发扬起来，中国人才有真进步。-《鲁迅全集》　　我死以后，把我的骨灰送到家乡……把它埋了，上头种一棵苹果，让我最后报答家乡的土地，报答父老乡亲。-彭德怀　　人民不仅有权爱国，而且爱国是义务，是一种光荣。-徐特立：《怎样实施爱国主义教育》　　纵使世界给我珍宝和荣誉，我也不愿离开我的祖国，因为纵使我的祖国在耻辱之中，我还是喜欢、热爱、祝福我的祖国！-《我是匈牙利人》 ...

09-10 教育科研自组织活动方案

教育科研自组织活动方案针对目前教师读书不多、不精、不专的状况，开展具有针对性和实效性的教育理论学习，用理论指导教学实践十分必要。通过对某些针对性强的经典的教育理论的学习和交流，可以使教师扎实掌握基本的教育理论，激活教师的思维，规范和创新自己的教学行为，有效提高教学质量。同时，读书如果成为教师生活的一部分，成为一种习惯和需求，教师的专业发展水平就会迅速提高。为了达到这一目标，现特成立"凤凰读书会" ...

12-05 2014年安徽高考语文试卷评析

20XX年安徽高考语文试卷评析 -平稳朴实不乏新颖彰显能力个性鲜明 ◇天长市第三中学吴正鹏第一眼看到20XX年安徽高考语文试卷，觉得有一种似曾相识的感觉。可以用平稳朴实，平易近人来形容。在认真做了这份试卷和仔细分析之后，这份试卷不仅平稳朴实，平易近人，而且不乏新颖。透出的是个性鲜明，彰显能力的特征，透出的是浓浓的人文和时代气息，透出的是浓浓的地域特色。比较近几年的安徽高考语文试卷，可以看出安徽 ...

03-28 团日活动建筑模型设计与制作竞赛方案

团日活动建筑模型设计与制作竞赛方案一、竞赛题目及竞赛简介建筑模型设计与制作是设计专业的一项重要的专业基础，也是培养现代设计人才及其综合设计能力不可或缺的构成部分，模型作为设计理念和形态的具体表现手段，二维的设计方案转化为三维的实施模型，使设想变为现实，是设计理念的立体表现技法。模型制作大赛旨在培养大学生的创新思维和实际动手能力，增强大学生的设计与实践能力，丰富校园学术氛围，促进本校大学生之间 ...

10-23 桥梁设计方案

作品名称索知桥参赛编号 D7 组长姓名吴波班级土木四班学号 20xx0119 队员姓名张积昱班级土木四班学号20xx0102 队员姓名徐玎班级土木四班学号 20xx0106 联系电话 15828044348；13608060453；15881024219. 西南交通大学第十届结构设计竞赛组委会二0一0年摘要桥梁结构的设计讲究造型美观、受力合理、节省材料、承载力大、制作 ...

随机推荐

猜你喜欢

隐马尔可夫模型

·工作思想鉴定

·婚礼男方父母贺词

·教师队伍建设年心得体会

·户外广告协议

·论中小企业的知识管理

·关于农村社会稳定情况的调查报告

·雷电颂[搞笑学生老师版]

·对抗雾霾吃萝卜[风味萝卜片]

·江泽民经济全球化本质论

·关于冬天的作文:闻冬踏雪

·建设局半年总结:创新发展理念建设宜居城乡

·2015年公共机构节能工作实施方案

·淘宝客服工作计划

·小学毕业班家长会精彩发言稿[1]

·经营许可证申请书

·中学综合实践活动课程实施的反思

·大班音乐欣赏活动:[半个月亮爬上来]

·风景园林27套考研快题

·阅读就是越读悦读孙道荣答案作者在第三段中写搬家处理杂物却一直随身

·完成版仓库管理系统总体设计说明书