信息论与编码论文

11-29

信息论与编码论文

信息论与编码之数据压缩

关键词：简介概要原理应用理论类型流行算法算法编码

简介

在计算机科学和信息论中，数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元（或者其它信息相关的单位）表示信息的过程。例如，如果我们将“compression”编码为“comp”那么这篇文章可以用较少的数据位表示。一种流行的压缩实例是许多计算机都在使用的ZIP 文件格式，它不仅仅提供了压缩的功能，而且还作为归档工具（Archiver）使用，能够将许多文件存储到同一个文件中。

概要

对于任何形式的通信来说，只有当信息的发送方和接受方都能够理解编码机制的时候压缩数据通信才能够工作。例如，只有当接受方知道这篇文章需要用英语字符解释的时候这篇文章才有意义。同样，只有当接受方知道编码方法的时候他才能够理解压缩数据。一些压缩算法利用了这个特性，在压缩过程中对数据进行加密，例如利用密码加密，以保证只有得到授权的一方才能正确地得到数据。

一些机制是可逆的，这样就可以恢复原始的数据，这种机制称为无损数据压缩；另外一些机制为了实现更高的压缩率允许一定程度的数据损失，这种机制称为有损数据压缩。然而，经常有一些文件不能被无损数据压缩算法压缩，实际上对于不含可以辨别样式的数据任何压缩算法都不能压缩。试图压缩已经经过压缩的数据通常得到的结果实际上是扩展数据，试图压缩经过加密的数据通常也会得到这种结果。

原理

事实上，多媒体信息存在许多数据冗余。例如，一幅图像中的静止建筑背景、蓝天和绿地，其中许多像素是相同的如果逐点存储，就会浪费许多空间，这称为空间冗余。又如，在电视和动画的相邻序列中，只有运动物体有少许变化，仅存储差异部分即可，这称为时间冗余。此外还有结构冗余、视觉冗余等，这就为数据压缩提供了条件。

应用

一种非常简单的压缩方法是行程长度编码，这种方法使用数据及数据长度这样简单的编码代替同样的连续数据，这是无损数据压缩的一个实例。这种方法经常用于办公计算机以更

好地利用磁盘空间、或者更好地利用计算机网络中的带宽。对于电子表格、文本、可执行文件等这样的符号数据来说，无损是一个非常关键的要求，因为除了一些有限的情况，大多数情况下即使是一个数据位的变化都是无法接受的。

在有损音频压缩中，心理声学的方法用来去除信号中听不见或者很难听见的成分。人类语音的压缩经常使用更加专业的技术，因此人们有时也将“语音压缩”或者“语音编码”作为一个独立的研究领域与“音频压缩”区分开来。不同的音频和语音压缩标准都属于音频编解码范畴。例如语音压缩用于因特网电话，而音频压缩被用于CD翻录并且使用 MP3 播放器解码。

理论

压缩的理论基础是信息论（它与算法信息论密切相关）以及率失真理论，这个领域的研究工作主要是由 Claude Shannon 奠定的，他在二十世纪四十年代末期及五十年代早期发表了这方面的基础性的论文。Doyle 和 Carlson 在2000年写道数据压缩“有所有的工程领域最简单、最优美的设计理论之一”。密码学与编码理论也是密切相关的学科，数据压缩的思想与统计推断也有很深的渊源。

信源编码中，有定长编码和变长编码。在定长编码中,K是定值。我们的目的是寻找最小K值。编码器输入X=(X1 X2…Xl …XL), Xl∈{a1,…an},

输入的消息总共有nL种可能的组合。输出的码字Y=(Y1 Y2 …Yk… YK ) , Yk∈{b1,…bm} 输出的码字总共有mK种可能的组合。若对信源进行定长编码,必须满足: nL≤mK。对于平均符号熵为HL(X)的离散平稳无记忆信源,必存在一种无失真编码方法,使平均信息率满足不等式HL(X)KHL(X) 其中ε为任意小正数。用变长编码来达到相当高的编码效率,一般所要求的符号长度L可以比定长编码小得多。编码效率的下界：HL(X)HL(X)KHL(X)L

类型

数据压缩可分成两种类型，一种叫做无损压缩，另一种叫做有损压缩。

无损压缩是指使用压缩后的数据进行重构(或者叫做还原，解压缩)，重构后的数据与原来的数据完全相同；无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平，无损压缩算法一般可以把普通文件的数据压缩到原来的1/2～1/4。一些常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv & Welch)压缩算法。

有损压缩是指使用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解。

流行算法

Lempel-Ziv（LZ）压缩方法是最流行的无损存储算法之一。DEFLATE是 LZ 的一个变体，它针对解压速度与压缩率进行了优化，虽然它的压缩速度可能非常缓慢，PKZIP、gzip 以

及 PNG 都在使用 DEFLATE。LZW （Lempel-Ziv-Welch）是 Unisys 的专利，直到2003年6月专利到期限，这种方法用于 GIF 图像。另外值得一提的是 LZR (LZ-Renau) 方法，它是 Zip 方法的基础。LZ 方法使用基于表格的压缩模型，其中表格中的条目用重复的数据串替换。

算法编码

算法编码简介

最好的压缩工具将概率模型预测结果用于算术编码。算术编码由 Jorma Rissanen 发明，并且由 Witten、Neal 以及 Cleary 将它转变成一个实用的方法。这种方法能够实现比众人皆知的哈夫曼算法更好的压缩，并且它本身非常适合于自适应数据压缩，自适应数据压缩的预测与上下文密切相关。算术编码已经用于二值图像压缩标准 JBIG、文档压缩标准 DejaVu。文本输入系统 Dasher 是一个逆算术编码器。

把信源输出序列的概率和实数段[0,1]中的一个数C联系起来。

设信源字母表为{a1, a2},其概率p(a1)=0.6, p(a2)=0.4

将[0,1]分成与概率比例相应的区间

,[0,0.6] [0.6,l]

设信源输出序列S=S1S2S3…Sn。当信源输出的第一个符号S1 = a1时,数C的值处在[0,0.6]，当信源输出的第一个符号S1 = a2时,数C的值处在[0.6,l]

一般多元信源序列的累积概率递推公式为：

P(S,ar)P(S)p(S)Pr，A(S,ar)p(S,ar)p(S)p(ar)

序列的概率公式为：p(S,ar)p(S)pr

实际应用中,采用累积概率P(S)表示码字C(S),符号概率p(S)表示状态区间A(S),则有： C(S,r) = C(S)+A(S)Pr

A(S,r) = A(S) pr

实际编码时,只需两个存储器,起始时可令:

A(Φ) =1, C(Φ) = 0

每输入一个信源符号,存储器C和A 就按照上式更新一次,直至信源符号输入完毕,就可将存储器C的内容作为该序列的码字输出。

编码方法：

将符号序列的累积概率写成二进位的小数，取小数点后L位,若后面有尾数,就进位到第L位,这样得到的一个数C,并使L满足

1Llogp(S)，取整

我们学习了几种信源编码：香农编码、费诺编码、哈夫曼编码、游程编码、算术编码。有时为了得到较高的编码效率，先采用某种正交变换，解除或减弱信源符号间的相关性，然后再进行信源编码；有时则利用信源符号间的相关性直接编码。

与《信息论与编码论文》相关的范文

04-01 集中实践性环节实施方案

集中实践性环节实施方案依据“江西广播电视大学人才培养模式改革与开放教育试点”汉语言文学专业本科集中实践环节教学实施细则，结合我市电大实际，对汉语言文学专业本科集中实践环节作如下安排。一、教学实习　教学实习为3学分，不得免修。（一）教学实习是“中央广播电视大学人才培养模式改革与开放教育试点”汉语言文学专业本科的集中实践环节之一。教学实习必须在修完汉语言文学专业80%的主干专业课程之后进行。（二 ...

04-09 生态节能.低碳生活创意设计大赛方案

一活动主题绿色生态，低碳生活，和谐校园二活动目的和意义我国西南五省严重干旱，为响应国家节能减排及可持续发展的战略方针，激发广大同学对于科技生态的探索与创造，为校园科技创新的发展注入青春和活力，特举办生态节能创意设计大赛三活动对象青岛农业大学全体在校学生四活动内容 1、申报阶段 20XX年5月4日-5月15日。 2、评选阶段 1）初评阶段：由评委老师对作品进行科学性和可行性的评价 ...

07-10 护士论文的书写格式和方法

护士论文的书写格式和方法　　一、护士论文题目（标题、文题）　　护士论文题目是全文给读者和编辑和第一印象，文题的好坏对论文能否利用具有举足轻重的作用。一个好的题目应尽可能在一完整的的句子中囊括三个基本要素，即研究对象、处理方法和达到的指标，使读者和编辑对论文研究的内容一目了然。例如：对心肌梗塞病人（研究对象）溶栓治疗（处理方法）监护指标的观察及护理（达到的指标），这三个要素并无先后之分，可根据文 ...

04-29 独家代理商合同

合同签定甲方：沈阳xxxx科技开发中心合同签定乙方：合同签定时间：20XX年月日代理商合同甲方：沈阳xxxx科技开发中心乙方：甲乙双方就合作开展“xxxx课程编码学习法系列产品”（注释1）的使用和推广应用，共同发动企业，组织和个人使用“xxxx课程编码学习法系列产品”进行学习的事宜进行友好协商，甲方同意乙方作为代理商，开展“xxxx课程编码学习法系列产品”业务，双方达成并同意遵照以 ...

08-06 农委蔬菜质量安全工作方案

蔬菜产品质量可追溯制度建设，是加强蔬菜质量安全监管，提高农业生产者的质量安全管理能力，推动蔬菜标准化生产，提升蔬菜质量安全水平，促进蔬菜产品市场竞争力提升，特别是保障**20**年世博会期间蔬菜质量安全的重要手段。根据中央一号文件提出的“加快完善农产品质量安全标准体系，建立农产品质量可追溯制度”以及农业部关于“加强农产品生产流通各环节的追溯管理和监督检查”的要求，切实做好蔬菜产品质量安全可追溯管理 ...

08-06 电子信息工程专业学生职业生涯规划

电子信息工程专业学生职业生涯规划业务培养目标：　　业务培养目标：本专业培养具备电子技术和信息系统的基础知识，能从事各类电子设备和信息系统的研究、设计、制造、应用和开发的高等工程技术人才。　　业务培养要求：本专业是一个电子和信息工程方面的较宽口径专业。本专业学生主要学习信号的获取与处理、电厂设备信息系统等方面的专业知识，受到电子与信息工程实践的基本训练，具备设计、开发、应用和集成电子设备和信息 ...

02-02 信息中心2014年新年贺词

信息中心2014年新年贺词我们即将迎来充满希望的2014年。一元复始，万象更新。向各位上实人、供应商及合作伙伴、各位朋友致以新年的祝福！ 20XX年，对公司和全体上实交通人而言，是不平凡的一年。信息中心在领导的英明指导及合作伙伴们的鼎力支持下，在全体人员的密切配合下，ERP工作取得了可喜的成绩。三四车间mRP运行成功、上实研发编码和SAP编码的统一、ERP上岗认证培训、Bom管理流程优化、2 ...

09-29 工程造价专业学生实习方案

很快的，实习工作将接近一年了，在这大半年里，我们在部门领导的关心安排下，分别在运行和检修两个工种间进行学习工作。这样的实习经验，我认为是难得可贵的，因为这样的安排让我们在短短一年里，简单地了解了变电、检修工作的范围及工作职责，也认识了变电及检修不同工种之间不同的工作方式和工作方法，真正体会到了大变电的含义。自实习到现今，我分别在220kV椹北巡检中心、500kV港城站、变电部电源班、变电部检修一 ...

03-23 数字化商务与现代物流配送中心整体解决方案

数字化商务与现代物流配送中心整体解决方案 第一期工程建设电子信息服务平台 第二期工程实施网络综合布线工程 第三期工程建立现代物流配送中心 第四期工程电子商务政务服务体系 xx市商业步行街数字化商务与现代物流配送中心第一期工程建设电子信息服务平台互联网以其大容量、高速度的信息传递方式迅速渗透到社会经济的各个环节，逐步成为新一轮经济的基础。它对社会经济的许多方面产生了深刻的影响 ...

09-20 高级秘书速记辅导:速记的概念

速记是运用符号、编码及其缩略形式快速手写记录或用电脑速录语言信息的实用技术。它既能速记或速录有声语言信息，又能速记或速录思维、文字等无声语言信息。在当今社会信息化的环境下，中文速记已成为人们高效、快速地处理中文信息的一种技能。　　速记和语言、文字一样，是人类通过长期劳动创造出来的。随着社会生产的发展和语言的日益丰富，在某些场合下，文字不能适应记录语言的要求。为了解决这个矛盾，人们在不断应用文字的 ...

随机推荐

猜你喜欢

信息论与编码论文

·超市经营的开业策划

·派出所社区(驻村)民警述职述廉报告

·我县非公经济代表人士工作调研报告

·学校安全生产月活动总结

·小学学年度科普工作计划

·儿童节活动邀请函

·2013年林业局宣传工作总结

·优美散文欣赏-- 在冬望春

·2016老子与论语今读期末答案

·[看见] 读书笔记

·小学品德优质课评比活动总结

·财政所个人工作自我总结

·五四青年节晚会策划书

·一个数除以分数教学设计

·明朝张居正廉洁故事

·意大利电影[美丽人生]的叙事策略分析

·肝胰脾外科发展规划

·教师课外阅读读书笔记与读后感

·怎么写星级宾馆可行性报告

·新手教师和专家型教师的区别