学位论文 > 优秀研究生学位论文题录展示
GPCA在视频可伸缩编码中的研究和应用
作 者: 姚蕾
导 师: 庄越挺;吴飞
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 视频编码 GPCA 混合线性模型 可伸缩性编码 运动模型
分类号: TN919.81
类 型: 硕士论文
年 份: 2007年
下 载: 61次
引 用: 0次
阅 读: 论文下载
内容摘要
数字存储、通讯和互联网的飞速发展使海量的视频数据出现在人们生活的方方面面,视频成为人们获得信息的主要载体。尽管网络带宽、磁盘容量、内存等还在持续增大,但对视频数据进行压缩是大部分媒体服务的前提,因此研究高效的视频压缩算法具有重要意义。此外,为了适应网络带宽的变化、支持不同的终端和达到更好的无线传输服务,人们提出了可伸缩性编码的概念,实现视频的可伸缩性,使得视频在可获得的资源下达到最佳质量。另一方面,视频的应用已走出以播放为目的的局限,视频数据的分析和理解也成为研究的热点。本文主要工作在于将Generalized Principal Component Analysis(GPCA)应用于视频编码,取代传统编码框架中的离散余弦变换(DCT),达到了更好的视频压缩效率,并在此基础上实现了信噪比(SNR)可伸缩性。另外,利用在运动预测得到的运动向量,尝试用GPCA为视频建立多运动模型,并检测运动物体。本文首先介绍了视频编码在通信、媒体服务等领域的重要性,根据现有几个重要的国际标准的演变历史,介绍了视频编码的发展情况和研究现状。第二章简要地描述了传统编码框架,并分析了新兴的视频编码标准H.264的特性。第三章介绍了可伸缩性编码的概念,着重描述Motion Compensation TemporalFilter(MCTF)及其对H.264在可伸缩性编码(SVC,Scalable Video Coding)方面的扩展。第四章简要地介绍GPCA的基本原理,并将GPCA引入到传统的编码框架中。GPCA的作用是为数据集估计混合线性模型,与PCA的单模型相比,多模型具有明显的优势,能更简洁地表达数据,揭示数据分布情况。我们用GPCA对残差作变换,消除数据的空间冗余,在此基础上实现了SNR可伸缩性,并讨论了降低编码算法复杂度的几种方法。第五章将GPCA用于分析视频中运动对象。与图像相比,视频的一个重要特点是相邻帧具有关联性,压缩算法的运动预测模块得到的运动向量反映了视频中物体的运动信息。不同的运动物体具有不同的运动模型,利用运动向量提供的运动信息为视频图像建立多运动模型,可以用于运动物体检测和跟踪。第六章具体描述了实验的过程,并对实验结果作了一定的分析。最后对本文作简要的总结,讨论了未来的研究方向。
|
全文目录
摘要 3-4 Abstract 4-9 第1章 绪论 9-11 1.1 课题背景 9 1.2 视频编码标准的发展 9-10 1.3 本章小结 10-11 第2章 视频编码原理 11-17 2.1 视频编码的基本框架 11-15 2.1.1 运动预测与运动补偿 11-12 2.1.2 变换和量化 12-14 2.1.3 熵编码 14-15 2.2 H.264的特性 15-16 2.3 本章小结 16-17 第3章 可伸缩性编码 17-25 3.1 可伸缩性编码原理 17 3.2 可伸缩算法 17-20 3.2.1 SNR可伸缩性 17-19 3.2.2 空间可伸缩性 19 3.2.3 时间可伸缩性 19-20 3.3 MCTF的可伸缩性框架 20-23 3.3.1 H.264的参考帧 20-21 3.3.2 MCTF原理 21 3.3.3 MCTF对H.264的扩展 21-23 3.3.4 MCTF实现可伸缩性 23 3.4 本章小结 23-25 第4章 基于GPCA的视频可伸缩性编码 25-40 4.1 GPCA原理 25-27 4.2 GPCA在视频编码中的应用 27-33 4.2.1 图像残差的向量表示 27-30 4.2.2 向量集初步降维 30-31 4.2.3 降维后的向量集的分组 31-32 4.2.4 视频残差的重建 32-33 4.3 GPCA的可伸缩性 33-35 4.4 降低编码算法复杂度 35-38 4.4.1 快速运动预测算法 36-37 4.4.2 向量分组预测 37 4.4.3 NNGPCA 37-38 4.5 本章小结 38-40 第5章 视频的运动分析 40-43 5.1 视频的对象分割 40 5.2 运动分割 40-42 5.3 本章小结 42-43 第6章 实验结果 43-49 6.1 视频残差的压缩 43-47 6.2 向量分组的层间预测 47 6.3 运动分割 47-48 6.4 本章小结 48-49 第7章 结束语 49-51 7.1 总结 49 7.2 展望 49-51 参考文献 51-54 攻读硕士学位期间主要的研究成果 54-55 致谢 55
|
相似论文
- 末制导段导引控制方法研究,TJ765.3
- 基于分布式视频编码错误消除机制的研究与实现,TN919.81
- 分布式视频编码边信息生成研究,TN919.81
- 基于多视频矩阵控制协议的远程视频监控系统的设计与实现,TP277
- 基于LDPCA的分布式视频编码中的非均衡编码,TN919.81
- 基于H.264的解码器端错误遮蔽方法研究,TN919.81
- 分布式视频编码中边信息技术研究,TN919.81
- 基于H.264/AVC可分级视频编码算法的研究,TN919.81
- 高效三维视频表达及编码技术研究与开发,TN919.81
- 基于CUDA架构的H.264并行计算研究,TN919.81
- 基于多激光雷达的行人目标跟踪,TP391.41
- 无线传感器网络中视频编码的跨层优化研究,TN919.81
- 面向窄带通信的视频编码技术研究,TN919.81
- 基于压缩感知的分布式视频编码技术研究,TN919.81
- SVC分层视频传输的自适应LDPC-UEP方法研究,TN919.8
- 基于Cortex-A8平台的H.264解码器优化,TN919.81
- 家庭信息终端中视频编码模块的设计与实现,TN919.81
- NVD高清视频编著系统的设计与实现,TP391.41
- 基于超高清视频编码的同步分层运动估计架构的设计,TN919.81
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
- 车载自组织网络中路径还原算法和路由协议的研究,TN929.5
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com
|