图像格式转换实验报告

01-31

实验1 图像格式转换实验报告

学号：

姓

班级：

一、实验目的掌握两种以上图像的格式，重点掌握BMP 图像格式。

二、实验原理：

1、JPEG 文件的解码过程。

①．读入文件的相关信息

按照上述的JPEG 文件数据存储方式，把要解码的文件的相关信息一一读出，为接下来的解码工作做好准备。参考方法是，设计一系列的结构体对应各个标记，并存储标记内表示的信息。其中图像长宽、多个量化表和哈夫曼表、水平/垂直采样因子等多项信息比较重要。以下给出读取过程中的两个问题。

1）整个文件的大体结构

JFIF 格式的JPEG 文件(*.jpg)的一般顺序为：

SOI(0xFFD8)

APP0(0xFFE0)

[APPn(0xFFEn)]可选

DQT(0xFFDB)

SOF0(0xFFC0)

DHT(0xFFC4)

SOS(0xFFDA)

压缩数据

EOI(0xFFD9)

2）字的高低位问题

JPEG 文件格式中，一个字（16位）的存储使用的是 Motorola 格式, 而不是 Intel 格式。也就是说, 一个字的高字节（高8位）在数据流的前面, 低字节（低8位）在数据流的后面，与平时习惯的Intel 格式不一样。.

3）读出哈夫曼表数据

在标记段DHT 内，包含了一个或者多个的哈夫曼表。不同位数的码字数量JPEG 文件的哈夫曼编码只能是1~16位。这个字段的16个字节分别表示1~16位的编码码字在哈夫曼树中的个数。编码内容这个字段记录了哈夫曼树中各个叶子结点的权。所以，上一字段（不同位数的码字数量）的16个数值之和就应该是本字段的长度，也就是哈夫曼树中叶子结点个数。

4）建立哈夫曼树

读出哈夫曼表的数据后，就要建立哈夫曼树。

②．初步了解图像数据流的结构

a) 在图片像素数据流中，信息可以被分为一段接一段的最小编码单元（Minimum CodedUnit ，MCU ）数据流。所谓MCU ，是图像中一个正方矩阵像素的数据。矩阵的大小是这样确定的：查阅标记SOF0，可以得到图像不同颜色分量的采样因子，即Y 、Cr 、Cb 三个分量各自的水平采样因子和垂直采样因子。大多图片的采样因子为4：1：1或1：1：1。其中，4：1：1即（2*2）：（1*1）：（1*1））；1：1：1即（1*1）：（1*1）：（1*1）。记三个分量中水平采样因子最大值为Hmax ，垂直采样因子最大值为Vmax ，那么单个MCU 矩阵的宽就是Hmax*8像素，高就是Vmax*8像素。

如果，整幅图像的宽度和高度不是MCU 宽度和高度的整数倍，那么编码时会些数

值填充进去，保证解码过程中MCU 的完整性（解码完成后，可直接忽视图像宽度和高度外的数据）。在数据流中，MCU 的排列方法是从左到右，从上到下。

b) 每个MCU 又分为若干个数据单元。数据单元的大小必定为8*8，所以每个MCU 的数据单元个数为Hmax*Vmax。另外JPEG 的压缩方法与BMP 文件有所不同，它不是把每个像素的颜色分量连续存储在一起的，而是把图片分成Y ，Cr ，Cb 三张子图，然后分别压缩。而三个颜色分量的采样密度（即采样因子）可能一样（例如1：1：1）也可能不一样（例如4：1：1）。每个MCU 内部，数据的顺序是Y 、Cr 、Cb 。如果一个颜色分量有多个数据单元，则顺序是从左到右，从上到下。

③．颜色分量单元的内部解码

1）理论说明

“颜色分量单元”是笔者为说明问题而建立的概念，指的是MCU 中某个颜色分量

的一个8*8数据块，例如上面提到的Y 1 、Cr 1、Cb 1 都是一个颜色分量单元。图像数据流是以位（bit ）为单位存储信息的。并且内部的数据都是在编码时通过正向离散余弦变换（FDCT ）进行时空域向频率域变换而得到的结果，所以对于每个颜色分量单元都应该由两部分组成：1个直流分量和63个交流分量。解码的过程其实就是哈夫曼树的查找过程。

颜色分量单元内部综合运用了RLE 行程编码和哈夫曼编码来压缩数据。每个像素的数据流由两部分构成：编码和数值，并且两者基本以互相隔开方式出现（除非该编码的权值为零）。具体读入单个颜色分量单元的步骤如下：

a ）从此颜色分量单元数据流的起点开始一位一位的读入，直到读入的编码与该分量直流哈夫曼树的某个码字（叶子结点）一致，然后用直流哈夫曼树查得该码字对应的权值。权值（共8位）表示该直流分量数值的二进制位数，也就是接下来需要读入的位数。

b ）继续读入位数据，直到读入的编码与该分量交流哈夫曼树的某个码字（叶子结点）一致，然后用交流哈夫曼树查得该码字对应的权值。权值的高4位表示当前数值前面有多少个连续的零，低4位表示该交流分量数值的二进制位数，也就是接下来需要读入的位数。

c ）不断重复步骤b ，直到满足交流分量数据结束的条件。而结束条件有两个，只要满足其中一个即可：①当读入码字的权值为零，表示往后的交流变量全部为零；②已经读入63个交流分量。

d ）各个数值的译码是按下表进行的：

④．直流系数的差分编码

把所有的颜色分量单元按颜色分量（Y 、Cr 、Cb ）分类。每一种颜色分量内，相邻的两个颜色分量单元的直流变量是以差分来编码的。也就是说，通过步骤3解码出来的直流变量数值只是当前颜色分量单元的实际直流变量减去前一个颜色分量单元的实际

直流变量。也就是说，当前直流变量要通过前一个颜色分量单元的实际（非解码）直流分量来校正：

DCn=DCn-1+Diff

其中Diff 为差分校正变量，也就是直接解码出来的直流系数。但如果当前颜色分量单元是第一个单元，则解码出来的直流数值就是真正的直流变量。

⑤．反量化

不同的颜色分量使用不同的量化表，这个可以从标记段SOF 中的颜色分量信息字段查得。一般是Y 分量使用量化表0，而Cr 、Cb 两个分量共同使用量化表1。

反量化的过程比较简单。只需要对8*8的颜色分量单元的64个值逐一乘以对应的量化表内位置相同的值则可。图像内全部的颜色分量单元都要进行反量化。

⑥．反Zig-zag 编码

如果将反量化后的每个8*8颜色分量单元的每个元素编号，如下图4，那么各反Zig-zag 编码的过程就是把矩阵元素按图5重新排列。

关于量化和反Zig-zag 编码的先后顺序，笔者查阅的几份资料有不同的见解。经过实践试验，解码的过程中，是应该直接用文件提供的量化表反量化矩阵数据，再将其反Zig-zag 编码才能正确解码。

⑦．隔行的正负纠正

这个问题比较特别，因为在笔者认真阅读的几份资料中都没有提及此问题。而是笔者通过对已知图像进行JPEG 编码压缩，然后和该图的JPEG 文件数据对比发现的问题。具体原因不明。

实际上，就是必须对每个颜色分量单元的奇数行（每个颜色分量单元有8行，假设把它按0、1、……、6、7编出行号），即1、3、5、7行，进行取相反数操作（正的变负，负的变正）。

⑧．反离散余弦变换

之前提到，文件中的数据是在编码时通过正向离散余弦变换（FDCT ）进行时空域向频率域变换而得到的结果，所以现在解码就必须将其反向离散余弦变换（IDCT ），就是把颜色分量单元矩阵中的频率域数值向时空域转换。并且，原来的频率域的矩阵大小为8*8，则经过反向离散余弦变换后，时空域的矩阵仍然是8*8。

设正负纠正后的频率域矩阵为F[u][v]，而反向离散余弦变换后的矩阵为f[i][j]，其中0≤u,v,i,j≤7。

⑨．YCrCb 向RGB 转换

要在屏幕上显示图像，就必须以RGB 模式表示图像的颜色。所以，解码时需要把YCrCb 模式向RGB 模式转换。

正如前面提到，并不是每种颜色分量的采样因子都一样，所以转换时需要注意。如果采样因子是1：1：1，则每一个像素点的3个颜色分量都被采样，所以没有问题。但

4：1：1的采样因子就不一样了。由“初步了解图像数据流的结构”一节中对4：1：1的采样因子的分析，可以知道一个MCU 里有4个Y 分量单元，而Cr 分量和Cb 分量各自只有1个分量单元。以图2为例，仅有的一个Cr 分量单元（红色的64个采样点）应该平铺用于4个Y 分量单元，即左上角16个值用于Y1，右上角16个值用于Y2，左下角16个值用于Y5，右下角16个值用于Y6。换句话说，一个Cr 采样点服务于4个Y 采样点。对于Cb 分量，道理一样。

另外，由于离散余弦变化要求定义域的对称，所以在编码时把RGB 的数值范围从[0，255]统一减去128偏移成[-128，127]。因此解码时必须为每个分量加上128。具体公式如下：

R=Y +1.402*Cb +128;

G=Y-0.34414*Cr -0.71414*Cb +128;

B=Y +1.772*Cb +128;

还有一个问题，通过变换得出的R 、G 、B 值可能超出了其定义域，所以要作出检查。如果大于255，则截断为255；如果小于0，则截断为0。

2、BMP 文件格式

① BMP文件头：BMP 文件头数据结构含有BMP 文件的类型、文件大小和位图起始位置等信息。 typedef struct tagBITMAPFILEHEADER{

WORD bfType; // 位图文件的类型，必须为BM

DWORD bfSize; // 位图文件的大小，以为单位

WORD bfReserved1; // 位图文件保留字，必须为0

WORD bfReserved2; // 位图文件保留字，必须为0

DWORD bfOffBits; // 位图数据的起始位置，以相对于位图文件头的偏移量表示，以为单位

} BITMAPFILEHEADER;

② 位图信息头：BMP 位图信息头数据用于说明位图的尺寸等信息。

typedef struct tagBITMAPINFOHEADER{

DWORD biSize; // 本结构所占用数

LONGbiWidth; // 位图的宽度，以像素为单位

LONGbiHeight; // 位图的高度，以像素为单位

WORD biPlanes; // 目标设备的级别，必须为1

WORD biBitCount// 每个像素所需的位数，必须是1(双色),4(16色) ，8(256色) 或24(真彩色) 之一

DWORD biCompression; // 位图压缩类型，必须是 0(不压缩),1(BI_RLE8压缩

类型) 或2(BI_RLE4压缩类型) 之一

DWORD biSizeImage; // 位图的大小，以为单位

LONG biXPelsPerMeter; // 位图水平分辨率，每米像素数

LONG biYPelsPerMeter; // 位图垂直分辨率，每米像素数

DWORD biClrUsed;// 位图实际使用的颜色表中的颜色数

DWORD biClrImportant;// 位图显示过程中重要的颜色数

} BITMAPINFOHEADER;

③、颜色表：颜色表用于说明位图中的颜色，它有若干个表项，每一个表项是一个RGBQUAD 类型的结构，定义一种颜色。

typedef struct tagRGBQUAD {

BYTE rgbBlue;// 蓝色的亮度(值范围为0-255)

BYTE rgbGreen; // 绿色的亮度(值范围为0-255)

BYTE rgbRed; // 红色的亮度(值范围为0-255)

BYTE rgbReserved;// 保留，必须为0

} RGBQUAD;

位图信息头和颜色表组成位图信息，BITMAPINFO 结构定义如下:

typedef struct tagBITMAPINFO {

BITMAPINFOHEADER bmiHeader; // 位图信息头

RGBQUAD bmiColors[1]; // 颜色表

} BITMAPINFO;

④ 位图数据：位图数据记录了位图的每一个像素值，记录顺序是在扫描行内是从左到右, 扫描行之间是从下到上。位图的一个像素值所占的数:

当biBitCount=1时，8个像素占1个;

当biBitCount=4时，2个像素占1个;

当biBitCount=8时，1个像素占1个;

当biBitCount=24时,1个像素占3个;

Windows 规定一个扫描行所占的数必须是4的倍数(即以long 为单位), 不足的以0填充，一个扫描行所占的数计算方法:

DataSizePerLine= (biWidth* biBitCount+31)/8; // 一个扫描行所占的数

DataSizePerLine= DataSizePerLine/4*4; // 数必须是4的倍数

位图数据的大小(不压缩情况下):

DataSize= DataSizePerLine* biHeight;

三、实验操作

通过改变main 函数里下面语句，可以改变输入图片的名字：

if((hfjpg=_lopen("flower.jpg ",OF_READ))==HFILE_ERROR)

通过改变main 函数里下面语句，可以改变输出图片的名字：

hfbmp=_lcreat("bmp_pic.bmp",0);

直接运行就可以生成bmp 文件。

与《图像格式转换实验报告》相关的范文

05-27 辅助设备应用实训报告

辅助设备应用实训报告一、实训目的 1.了解打印机、扫描仪、刻录机等各种设备与计算机正确连接和驱动的正确安装。 2.熟练掌握打印机、扫描仪、刻录机、塑封机、数字设备等各种设备的正确配置，及正确使用这些设备和对一般故障的处理能力。 3.辅助设备的综合性应用的知识与技巧。 4.促使学生学习和获取新知识，掌握自我学习的能力。二、实训准备 1.从思想和心理准备做好实训准备。 2.认真阅读实训指导书。 3 ...

12-31 王阜庄小学现代远程教育资源库建设实施方案

王阜庄小学现代远程教育资源库建设实施方案为发挥我校农村中小学现代远程教育的优势，在全校营造更加浓厚的教育现代化、信息化氛围，我校决定在20XX年，全面加强我校教育教学资源库的建设工作，使远程教育资源真正融入到教育教学工作当中。为落实好各项工作任务，特制定本实施方案。一、工作目标各校要整合各级、各类优质教育教学资源,搭建多层次、智能化的开放式教育平台，逐步建设具有一定规模、符合本地实际的资源 ...

08-07 XX省电子文件归档与管理暂行规定

　　第一章总则　　第一条　为了加强全省的电子文件归档与管理，保障归档电子文件的安全保管和开发利用，根据《中华人民共和国档案法》、《XX省〈中华人民共和国档案法〉实施办法》、《电子文件归档与管理规范》、《XX省公文网上交换管理暂行办法》，特制定本规定。　　第二条　本规定适用于全省各级党政机关、社会团体，企事业单位及其他组织可参照执行（以下统称单位）。　　第三条　基本术语解释　　（一）电子文件 ...

09-06 高一物理学科知识竞赛试卷分析报告

高一物理学科知识竞赛试卷分析报告项正陈维龙一、命题总体思路本试卷是10学年高一物理竞赛试卷，考试内容为物理考试大纲规定的高考内容（必修1及必修2第六章为止）。试题设计指导思想:参照浙江省物理学科教学指导意见及物理考试大纲，坚持以学生为本，坚持实施素质教育。加强能力考查的力度，体现新课程改革精神，有利于创新精神和实践能力的培养，在命题中紧扣教材，突出重点，全面考核学生的基础知识、基本技能和 ...

05-22 XX高速公路联网收费防止换卡逃费的解决方案

　　一、概述　　由于采用了非接触Ic卡通行券，封闭式收费系统中存在的制假卡（纸卡、穿孔卡）、改卡（纸质卡）、废卡重用（磁性卡）等现象已能有效地杜绝，但各种通行券存在的换卡问题，多年来还没有找到既经济又实用的和能完全杜绝换卡现象的方法。　　以下提出的利用摄像机图像由人工输入牌照号码后三位的方案是在当前情况下比较实用的方案，但从长远看采用牌照识别技术是解决司机换卡问题的技术途径。利用牌照号码输入防 ...

11-22 研究性学习结题报告的写作

研究性学习结题报告的写作 ⒈结题报告的一般格式研究性学习的结题报告形式多样，有文献研究、调查研究和实验研究等，但基本格式大同小异，一般由标题、摘要、研究背景、正文、参考文献等部分组成。 ⒈⒈标题标题是课题研究内容的高度概括，在整篇论文中起“画龙点睛”作用。标题名称要注意以下几点：⑴引人注目。题目要新颖，醒目得体，能准确表达研究内容，恰如其分地反映课题研究的广度和深度。切忌“体会”、“浅谈”、“ ...

08-15 2014年高考物理试卷分析(海南卷)

20XX年高考物理试卷分析(海南卷)海南省教育研究培训院总体评价 20XX年普通高等学校招生全国统一考试新课程标准试卷（海南卷）依据《20XX年普通高等学校招生全国统一考试大纲（理科•课程标准实验版）》和海南省的《20XX年普通高等学校招生全国统一考试大纲的说明（理科•课程标准实验版）》（以下简称《说明》）进行命题，试卷为单科独立试卷。试卷在保持平稳的基础上，结合海南实际，针对性地对部分试题的难 ...

12-06 锦湖实验小学第二届科技节实施方案

锦湖实验小学第二届科技节实施方案以科学发展观为指导，弘扬科学精神，丰富学生的学习生活，激发学生的创新精神和科学兴趣，培养学生的实践能力，努力提高学生科学素养，提高我校科技教育工作的质量和水平，从而全面推进学校素质教育。特制订本方案。一、活动主题体验创新成长二、活动口号科技引领携手创新共建和谐三、活动内容开展“五个一”活动：读一本科普读物；聆听一次科普知识讲座；参加一次科普知识 ...

12-22 初中地理课程标准

第一部分　前言(7-9'GEo'1) 一、背景(7-9'GEo'1.1) 　　当今世界，人口、资源、环境问题日益突出，南北发展差距不断扩大，在世界多极化和经济全球化的曲折发展中，和平与发展仍是时代的主题。在我国，要坚持实施可持续发展战略，促进人与自然的协调与和谐，改善生态环境，增强区域经济发展活力，加速现代化进程。这些都给地理课程改革提出了挑战和有待探索的新课题。关注全球性问题和我国新世纪所面临的 ...

05-22 七年级下学期数学教学计划

一、学情分析七（1）班共42人，相对二班而言，上课学习积极性不是很高，学习自觉性不佳，成绩距离二班有一定的差距，学生两级分化严重，二班学生共有41人，学生相比而言比较活跃，学习积极性高，成绩较为理想，但仍然是两级分化严重，两个班都有数量不少的基础差，对数学不怎么感兴趣，且学习方法、读书习惯、作业习惯都不佳的学生，这一部分学生对图形这一部分的学习难度还少些，而对于代数部分就感觉难度很大，这一部分学生 ...

随机推荐

猜你喜欢

图像格式转换实验报告

·争当优秀共产党员承诺书

·自我鉴定写作须知

·个人薪金收入证明书

·学生会学期工作总结与下学期工作计划

·新建商品房买卖合同

·机械行业员工辞职报告范文

·普法修德守纪演讲稿

·(00294)2012年1月劳动社会学自考试卷及答案

·2016年上海市公务员考试资料分析题解题技巧

·教师争先创优心得体会

·中考总结

·事业单位年终总结

·毕业班会议主持词

·初中生毕业感言写作

·蹲踞式跳远教案

·5·12国际护士节活动总结

·2013年莆田化学中考试卷及评分标准(化学)

·台湾著名教育家许宜铭先生"关于亲子"演讲精选(2)

·健美操在小学体育课堂教学中的运用

·上海财税服务收费标准