信息论实验报告

08-20

游程编码实现有效性提高的原理及通用编码的思想

康乐 [1**********]0

摘要：信源编码的目的是提高信息传输效率，其思想是去除消息中的冗余成分。在无失真的信源编码中，根据信源的统计特性进行编码称为统计编码，而在信源统计特性未知的情况下，就需要一种新的编码方法，称之为通用编码。本文对统计编码中的游程编码进行了分析，说明其有效性，给出其具有有效性的原理论述，对游程编码的截断效应进行了仿真；同时分析了通用编码的存在性与构造方法，还以字典码为例进行了仿真。

关键词：信源编码游程编码通用编码字典码

一、信源编码概述

通信的根本问题是将信源的输出在接收端精确的或近似的重现出来。为此需要解决两个问题。其一是信源的输出应如何描述，及如何计算它产生的信息量；其二是如何表示信源的输出，即信源编码问题。由于信源可以根据信息输出的形式分为离散信源和连续信源，因此信源编码也就可以分为离散信源和连续信源。

根据通信的要求，可以将信源编码分为无失真信源编码和限定失真的信源编码。若要求精确的重现信源的输出，就要保证信源产生的

全部信息无损的传递给信宿，这时的信源编码就是无失真信源编码。许多实际情况下，并不要求完全精确地复制出信源的输出，而且在有干扰的情况下，这也是不可能的。一般对信源-信宿要定出可接收准则或保真度准则，这就是限定失真的信源编码。离散信源的输出可以用如下符号序列表示：

U2,U1,U0,U1,U2,

其中Ul表示在第l时刻产生的符号，l为整数。Ul为一随机变量，它在有限字母集Aa1,ak中选取。如果使用D字母的集合

Bb1,bd作为码表，那么如果组成码字的码符号数目相等，我们就称之为等长编码，否则称之为非等长编码。

非等长编码则可以根据编码是否依赖信源的统计特性分为统计编码与通用编码。

二、游程编码 2.1 游程编码概念

游程编码（RLC, Run Length Coding），又称“运行长度编码”或“行程编码”，是一种统计编码，该编码属于无损压缩编码，是栅格数据压缩的重要编码方法。

游程编码中的游程是指字符序列中各个字符连续重复出现而形成的字符串长度，编码方法是将字符序列映射成字符串长度和位置的标志序列，那么对于M元序列：

{u0,u1,,uM1}

输入的消息序列U{ui,,ur,ur,ur,uk}中的符号Ur的游程长度L(r)就是其游程长度。

例如：[***********]1111111

行程编码为：（5，6）（7，5）（3，3）（2，4）（1，7）。可见，行程编码的位数远远少于原始字符串的位数。

2.2 游程编码有效性

行程编码是连续精确的编码，在传输过程中，如果其中一位符号发生错误，即可影响整个编码序列，使行程编码无法还原回原始数据。

游程长度在栅格加密时，数据量没有明显增加，压缩效率较高，且易于检索、叠加合并等操作，运算简单，适用于机器存储容量小，数据需大量压缩，而又要避免复杂的编码和解码运算，增加处理和操作时间的情况。

举例来说，一组输入序列"AAAABBBCCDEEEE"，由4个A、3个B、2个C、1个D、4个E组成，经过游程编码可将序列压缩为4A3B2C1D4E，即由14个单位转成10个单位长度。

简言之，其优点在于将重复性高的数据量压缩成小单位；然而，其缺点在于─若该字符出现频率不高，可能导致压缩结果数据量比原始序列大，例如：原始序列"ABCDE"，压缩结果为"1A1B1C1D1E"即由5个单位转成10个单位长度。

2.3 游程编码有效性原理

由于游程编码并没有一个完备的数学公理体系作为支撑，因此想要分析它的有效性就要分类进行，本文只讨论了二元游程编码以及多元游程编码中的冗余位编码的有效性原理。冗余位编码对于M元序列：

{u0,u1,,uM1}

当M≥3时，只凭借游程长度L无法实现可逆的编码，需要添加其他

符号。当M很大时，附加标志可能抵消压缩编码的好处。但是有一种特殊情况,当输入序列为：

Ux1x2x3xm1yyyyyyxm11xm2yyyy 经过游程编码可以分解为以下两个序列：

L1111000000110000

U'x1 x2 x3 xm1 xm11xm2

即将一个多元序列分解为一个二元序列和一个缩减多元序列，从而提高了编码效率。二元游程编码

对于二元相关信源来说，对其N次扩展信源编码才能提高编码效率。这将产生符号数剧增，码字多，译码复杂，符号间相关性没有利用等等一系列问题。

而对于二元相关信源，游程编码可以只凭借游程长度L实现可逆的编码，下面给出有效性的证明：

假设游程编码将二元相关信源编码为黑游程与白游程，分别对应 1与0的长度。那么可以得到白游程熵：

lw为白游程长度，L为白游程最大长度

由信源编码定理：

Lw为白游程平均码长。

所以白游程长的平均值为：

联立上述几式可得：

白像素熵值为：

白像素平均码长为：

带入（4）式中可得：

同理对黑游程也可以得到：

每个像素的熵值：

……..………..…….(8)

每个像素平均码长：

将（5）乘以Pw加上（7）乘以PB：

可以看出二元相关信源编码后的平均码长仍以信源熵为极限，所以压缩效率较高。

三、通用编码 3.1 通用编码的存在性

统计分布需要精确的知道信源的概率分布，或者对信源的实际分布和假设分布之间的偏差很敏感时。一旦实际分布与假设分布有差异时，通用编码的性能会急剧下降。但在实际应用中，想要确切的获得信源的统计特性是十分困难的，这时就需要寻找一种与信源统计特性无关的编码方案。

由香农第三定理，只要码长足够长，总可以找到一种信源编码，使得编码后的信息传输率略大于率湿疹函数，而编码的平均失真度不大于给定的允许失真度。这就说明了至少存在有限失真的通用编码方法，使得编码长度足够大时，错误概率任意小。

3.2 通用编码的构造方法

由于统计特性不确知是通用编码的困难之处，因此可以考虑对信源的概率统计特性进行估计，并用估计的统计特性为基础，将类似于统计编码的设计思路应用到通用编码上。这种构造方法一般的特点是

边统计，边编码，以使得完成的编码与心愿的概率统计特性近似的匹配。

另外一种构造方法是考虑到通用编码存在的依据：只要编码速率R＞H(x)， H(x)是信源熵，那么当编码长度充分的大时，可以使得译码错误概率任意小。那么只要对平均码长做出约束，就可以大致确定通用编码的方式。这种构造方法是以序列复杂度的理论为基础，以求出平均码长极限，从而获得编码方案。

3.3 字典码

字典码是使用估计信源的统计特性来构造通用编码方法的典型应用。  编码

LZ编码器的输出是码字-字符(W,C)对，每次输出一对到码字流中，与码字W相对应的缀-符串用字符C进行扩展生成新的缀-符串，然后添加到词典中。是边生成字典，边编码的过程。编码算法

步骤1：在开始时，词典和当前前缀P都是空的。步骤2：当前字符C ：=字符流中的下一个字符。步骤3：判断P+C是否在词典中：

(1) 如果“是”：用C扩展P，让P ：= P+C ； (2) 如果“否”：

① 输出与当前前缀P相对应的码字和当前字符C；

② 把字符串P+C 添加到词典中。 ③ 令P ：=空值。

(3) 判断字符流中是否还有字符需要编码

① 如果“是”：返回到步骤2。

② 如果“否”：若当前前缀P不是空的，输出相应于当前前缀P的码字，然后结束编码。

图 1 字典码编码流程图

 译码

LZ的译码过程与之相反，将当前码字W对应的前缀输出，再输出当前编码对应符号C。从空集开始更新字典，不断添加新的缀-符串。是边生成字典，边译码的过程。译码算法

 步骤1： 步骤2： 步骤3： 步骤4：C。

 步骤5： 步骤6：在开始时词典是空的。

当前码字W ：=码字流中的下一个码字。当前字符C ：= 紧随码字之后的字符。输出当前码字的缀-符串到字符流，然后输出字符把W+C添加到词典中。

判断码字流中是否还有码字要译码 (1) 如果“是”，就返回到步骤2。 (2) 如果“否”，则结束。

四、总结

本文对统计编码中的游程编码进行了分析，说明其有效性，给出其具有有效性的原理论述，对游程编码的截断效应进行了仿真；同时分析了通用编码的存在性与构造方法，还以字典码为例进行了仿真。其中遇到的难点有以下几点：

 游程编码理论分析

 游程编码截断效应仿真

 通用编码构造方法总结图 2 字典码译码流程图

 字典码编程实现

解决问题的方法主要有：

 将游程编码视为黑白二种游程，先分别计算其平均码长，再将两种游程看成一种编码，计算其平均码长，从而说明游程编码是一种熵编码。

 游程编码的仿真中存在寻找不同游程变化点的过程，是整体算法计算复杂度最集中的部分，后来在改进中使用求导的方法来获得游程变化点，大大减少了复杂度，是的截断效应的仿真点数增多，效果能够更加明显。

 通用编码的构造方法在一般的教参中很少提及，大多含混而过，此处综合了许多文献的观点。

 字典码的编程实现还是较为复杂的，主要是编译码过程中对字典的构造需要大量的计算，但是通过改进，可以动态的建立字典，只需传递字典的大小而不必传输字典本身，并且可以将每一步的输出都输出出来，从而验证了代码的正确性。参考文献：

[1]. 徐利华, 陈早生. 二值图像中的游程编码区域标记[J]. 光电工程, 2004, 31(6):63-65. 最得力的参考文献

[2]. 魏佳圆, 温媛媛, 周诠. 二值图像游程-Huffman编码方法研究及Matlab实现[J]. 空间电子技术, 2015(1):93-96.

[3]. 谭兆信. 散列高阶字典编码及其实现[J]. 软件学报, 1998(8):632-636.

[4]. 李畅. 无损图像压缩算法与有损图像压缩算法分析[J]. 现代计算机：普及版, 2015(12):61-64.

与《信息论实验报告》相关的范文

06-09 小学科学实验室整改申请报告

小学科学实验室整改申请报告尊敬的学校领导：您们好。非常感谢您们能在白忙之中抽空看我们的申请报告，现将我们对科学实验室的观察、思考汇报给领导。根据我们的实地观察，结合我校实际，我们对学校科学实验室的整改提出一下几点建议一、教室内布局桌椅不合理。根据新课标要求科学教学重视过程，让学生在动手过程中体验，学习到知识技能。还要要求学生在操作过程中重视团结合作，培养他们的团队意识，合作意识以适应未来 ...

02-27 2014年下半年教学评价研究室工作计划

　　一、指导思想　　以教育部颁发的《基础教育课程改革纲要》、《教育部关于积极推进中小学评价与考试制度改革的通知》和《浙江省关于中小学评价与考试制度改革的指导意见》为导向，以中小学教学评价改革研究和教育信息化研究工作为重点，认真做好以下几方面的工作：　　二、工作重点　　（一）加强中小学评价改革研究　　1、加强中小学评价管理和指导，不断完善中小学评价改革管理制度，使全市中小学教学评价有章可循， ...

05-19 初中生物试卷分析报告

初中生物试卷分析报告一、对试卷的总体评价今年初中生物学科期末考试试题很好地体现了“三个有利于”的命题指导思想，依据《中学课程标准》，注重从知识与技能、过程与方法、情感态度与价值观三个层面上考查学生的生物基础知识和基本技能。试题设计注重理论联系实际和学生能力的考查，注重对学生所学知识在生活实践中应用方面的考查。试题的导向有利于教师在平时的教学中实施素质教育，培养学生的创新精神和实践能力，培养学生 ...

08-27 2013年-2014年学年度第一学期教育技术装备工作总结

20xx-20xx学年度中，我校根据县局精神，在对教育技术装备工作的全面开展作出了进一步明确的职能管理分工与要求后，先后三次分阶段地对学校教育技术装备进行了自查。具体做法如下：一、成立教育技术装备领导小组（一）学校教育技术装备工作领导小组姓名行政职务职称联系电话备注组长赵金锋校长中高 13815704755 副组长蔡茂宇副校长中一 13851360353 组员钮必政 ...

11-21 电子商务模拟实习报告

　　一、实习题目：电子商务模拟实习　　目的意义：通过该实验的学习，学生应能掌握电子商务中网店的搭建、安装、运营和维护等各个方面的具体操作。学生可以将平时学到的各种电子商务理论通过实践操作得到巩固，加深对所学理论认识和理解，增强自己的动手操作能力，从而将书本的理论和实际操作达到有机的结合。为学生今后从事电子商务相关工作打下良好的操作基础，能够顺利地从事电子商务相关的操作工作。　　实习地点：电子商 ...

12-16 XX小学教育科研管理条例

　　为全面提高教育教学质量，优化师资水平，根据学校教育科研与教学改革工作的需要，特制定本条例。　　第一部分：教科室的工作职责　　教科室是校长直接领导下的教育研究机构，它与学校的教导处、德育室并行，负责管理学校的教育科研工作，向校长负责，它所布置的工作任务是行政性的，全校的教职工应认真执行。　　其主要职责是：　　一、制定和实施学校的教科研工作计划，收集国内外教科研、教学管理工作的情报，为校长 ...

03-09 XX县霍乱防治应急预案

　　第一部分总则　　一、目的　　坚持预防为主、统一领导、分级负责、信息畅通、反应及时、依靠科学、措施果断、依法防治、加强合作的原则，保证在霍乱发生或者可能发生时，各级和有关部门能够及时、准确、充分动员应急资源，有效地实施预防、控制、救治等措施，及时控制霍乱疫情的发生和蔓延，确保在我县不发生霍乱暴发流行，力争不发生续发病例，力争不出现死亡病例。　　二、依据　　为有效预防、及时控制和消除霍乱的 ...

08-29 2014年上海市"医疗质量万里行"活动实施方案

　为深入贯彻落实《卫生部办公厅关于印发<20XX年“医疗质量万里行”活动方案>的通知》（卫办医政发〔20xx〕82号）的精神，结合医院管理年活动和“平安医院”创建工作，根据本市实际情况，特制定本方案。　　一、指导思想　　深入贯彻落实党的十七大、十七届三中全会和中央经济工作会议精神，认真学习实践科学发展观，坚持以人为本，以病人为中心，保证医疗质量和医疗安全，保障患者合法权益，努力为 ...

08-28 科研明星评选材料

科研明星评选材料大孤家中学杨宏发第一部分课题研究设计一、课题的提出 1、课题界定 ①农村初中：相对于城镇初中而言，教学条件简陋，缺乏优质师资。 ②任务型的教学模式是以具体的任务为学习动力或动机，以完成任务的过程为学习的过程，以展示任务成果的方式来体现教学的成就，这种教学模式实际上可以认为是以应用为动力，以应用为目的，以应用为核心的教学模式。 ③阅读教学模式：本课题中的“阅读教学模式”是指在 ...

03-13 中学新教育实验方案

中学新教育实验方案指导思想： 20XX年我校要全员启动，严格按照随县教育局有关推进新教育实验的文件，认真实施上级新教育实验方案，将新教育实验作为主线，纳入到教育教学工作中去，以教师的专业发展为起点，以六大行动为途径，通过实验提升师生品质，提升教育质量。实验领导小组：为搞好我校的新教育实施工作，学校成立实施新教育实验领导小组，组长：桂运涛，副组长：周后银、李德军、张小伟、黄公权，组员：李晓峰、 ...

信息论实验报告

·全过程会议礼仪

·黑龙江省教师资格证-2014年齐齐哈尔市教师资格认定公告

·光棍节的促销策划

·精子形成一般需要多长的时间

·五年级作文:上午篇--超载的危害

·半导体制冷技术及其应用

·描写我的家乡--广州作文250字

·人民海军精神

·创建文明城市我参与

·拥抱最纯粹的自己

·法治理念中心组学习发言

·小学语文骨干教师培训方案

·在教学工作会议讲话稿

·教师苦难辉煌读书笔记

·高中物理第一课

·蒙古族马文化的发展与保护

·[精品]挂牌仪式策划方案

·20151113-伺服专用电缆检验标准

·丑小鸭与我_400字

·这样的一个男人