博士 硕士论文题目: 可伸缩视频编码研究
博士/硕士论文题目: 可伸缩视频编码研究
答辩时间: 2008年5月13日
答辩委员会主席: 王鼎兴 答辩委员会成员:李锦涛、查红彬、戴琼海、卢汉清、尹宝才、林守
勋
毕业时间:
研究方向: 视频编码
导师: 赵德斌、高文 毕业去向:
曾获奖项: 中科院计算所所长特别奖、计算所优秀论文奖 毕业论文的摘要
摘 要
在基于互联网的新数字媒体环境下,越来越多的视频内容在互联网上进行传递。然而,
Internet 由于其自身设计和构造的特点,并不具有服务质量(QoS )的保障,时延和丢包率
等也是随时间动态变化的;此外,网络传输视频信息的内容与形式非常丰富,使用不同设备
的不同用户对不同的视频内容也会有不同服务质量的要求。因此,面向互联网的视频服务给
流化视频编码技术提出了新的问题。一个基本方法是使编码生成的码流具有高度可伸缩性,
能够根据网络条件的变化和接收端的要求随时对码流进行调整。 同时,这些可伸缩功能可
以很好地提供内容的层式保护、多通道内容的制作与分发、灵活的视频会议、移动商务、视
频点播系统、多点的监控系统和端到端的无线传输等。
本文对可伸缩视频编码中时域、空域与质量可伸缩以及它们的组合编码进行
了深入的研究,提出了高效、简单、鲁棒的可伸缩编码方法。主要内容包括:
1.在时域可伸缩编码方面,研究了高效的B 帧编码技术。提出了两种高效的双
向预测模式,即对称预测模式与直接预测模式。这两项技术均已被A VS 接受。
第一项技术用于替代传统双向预测模式,此模式只需要一个运动矢量被编码,
在假设运动近似匀速的条件下,另一个运动矢量可以由它推导出来。这种模
式可以在预测精度与运动矢量信息编码所需比特数之间取得有效的平衡, 从
而可以获取更好的率失真性能。第二项技术是改进的时域直接模式,它不但
解决了A VS 标准中B 帧与P 帧都只有两个参考帧缓冲区限制下如何正确得到参考索引的问题,而且在保持高精度时域直接模式运动矢量的推导中避免了除法运算。
2. 提出了一种低复杂度的块级运动矢量精度自适应B 帧编码方法,这种方法可
以使B 帧双向预测块自适应地选择运动矢量精度来降低运动补偿插值的复杂度。根据运动补偿线性插值的性质,对双向预测块前后向亮度预测信息的运动补偿插值进一步地合并,从而再一次降低基于子像素的双向预测块的运动补偿复杂度。此外,本文还为双向预测块提出了一种简单的色度运动补偿插值方法。实验结果表明,这种方法可以在与现有方法保持相当编码效率情况下,极大地降低B 帧解码复杂度,甚至可以比P 帧有更低的运动补偿复杂度。
3. 在质量可伸缩视频编码方面,提出了一种对多个质量增强层进行不同漏预测
的质量精细可伸缩视频编码方法。首先假设基本层码流和部分增强层码流可用情况下,对基于两个漏因子的漏预测方法给出了误差传递理论分析。基于这种分析,提出了如何有效地产生用于增强层预测的信息。通过选择合适的漏因子,可以有效地将增强层的信息引入预测环内,从而使得这种方法在达到高效编码的同时又能有效地抑制漂移误差。进一步,为了降低解码复杂度,提出了变换域系数缩放方法来解决部分增强层的多次重构问题。另外,提出了一种编码优化方法来改善多FGS 层编码的漂移误差问题。实验结果表明,与现有的质量精细可伸缩视频编码方法相比,所提出的方法可以有效地抑制漂移误差,因此极大地提高了编码效率。
4. 提出了应用于低延时传输的基于小波与漏预测的空域-质量组合的可伸缩视
频编码。现有的基于分层编码的方法支持空域-质量组合的可伸缩视频编码,但通常不能有效地去除不同空域分辨率层间的冗余,这往往使得高分辨率层的编码效率不够理想。在所提出的方法中,通过小波变换来实现空域分辨率可伸缩以保证消耗在低分辨率图像上的比特能够全部为高分辨率层使用。通过空-频域运动补偿相结合的漏预测方法来实现对编码效率与漂移误差的控制。另外,根据不同误差传递率的应用需求,给出了最优漏因子选择的理论指导。
5. 提出了一种基本层嵌入H.264/AVC 编码的三维小波全方位可伸缩视频编码方
案。三维小波视频编码通过开环运动补偿机制来实现其视频流的高度可伸缩性,因此往往很难在特定码率点达到最优的率失真性能,尤其是在低码率点,由于过多的比特数花费在运动信息编码上,不能产生令人满意的视频质量。一种有效的方法是对最低分辨率的基本层利用H.264/AVC 编码来有效提高低码率点视频的质量。一方面,采用优化的基本层编码结构,增强层可以充分利用基本层的重构信息;另一方面,通过在时域小波变换中引入一种帧内模
式编码,可以有效抑制“t+2D”方案中低分辨率视频解码的运动非对齐空域混叠效应。
6. 提出了一种用于H.264/AVC SVC中分级B 帧编码时整帧丢失的错误隐藏算
法。作为H.264/AVC 可伸缩部分的扩展,可伸缩编码(H.264/AVC SVC)为生成的码流提供了灵活的时域、空域和质量的可伸缩性。但是,在不可靠网络中传输时,如果出现信息包丢失,即使是可伸缩的视频码流解码后的质量仍然会很差。在我们提出的算法中,通过利用相邻视频图像的时域运动关系,可以简单有效地推导丢失帧的运动信息,从而可以在正确接收的前向和后向参考图像上进行运动补偿来恢复丢失帧。实验结果表明,当发生信息包丢失时,与H.264/AVC SVC中使用的错误隐藏算法相比,本文提出的错误隐藏算法可以明显地提高解码视频的主、客观质量。该算法也可以应用于带可分级B 帧编码的H.264/AVC 码流的错误隐藏,同时也可以扩展到三维小波编码中时域高频子带的错误隐藏。