学位论文 > 优秀研究生学位论文题录展示
张量分解及其在动态纹理中的应用
作 者: 周丙寅
导 师: 彭立中; 蒋春澜
学 校: 河北师范大学
专 业: 基础数学
关键词: 张量分解 动态纹理 紧凑表示 数据降维 视频编码 人群密度估计
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 0次
引 用: 1次
阅 读: 论文下载
内容摘要
动态纹理是图像序列的重要信息和特征,它是图像序列中一类空间上重复、时间上变化并且满足某种平稳特性的视觉模式,例如火焰和飘扬的旗帜等.作为一类重要的自然视频信号来源,它通常会产生极大量的高维数据,因此,迫切需要提出有效的分析和处理方法.由于动态纹理具有复杂的运动特性,使得其研究更具挑战性.张量是向量和矩阵在组织结构上由低维向高维扩展所得到的一般形式,它是高维数据的自然表示方式,能够保持数据的内在结构.张量分解是矩阵奇异值分解的高阶扩展,被认为是高维数据处理最具潜力的方法之一.最近十几年来,张量方法的研究兴趣已经扩展到信号和图像处理等领域,为基于矩阵的传统高维数据分析和处理方法开拓了新的思路.本文研究张量分解及其在动态纹理中的应用,主要取得如下成果.1.提出一个保持高维数据内在结构的张量动态纹理模型,并提出一个相应的参数估计算法.与近十几年内动态纹理领域开创性的研究成果――线性动态纹理模型相比,提出的模型能够从不同模式,例如空间、颜色和时间,对动态纹理的特性进行灵活刻画,从而能够更充分的挖掘动态纹理的内在特征和性质.2.将提出的张量动态纹理模型用于动态纹理合成这一实际应用,进行大量对比实验和分析.实验结果表明,与线性动态纹理模型相比,我们的模型能够在模型大小较小的情况下,显著提高合成动态纹理的视觉效果,平均PSNR能够提高2dB至7dB.3.提出高维数据紧凑表示的概念,是对稀疏表示概念的一步推进.考虑到保持数据的内在结构,提出一个张量多次低秩逼近算法,用于得到一个紧凑表示.我们的算法能够灵活实现不同低秩逼近,且能够在计算复杂度和逼近精度之间取舍.4.将提出的张量紧凑表示方法用于动态纹理的紧凑表示和编码,由于能够更好的保持数据的内在结构,使得编码性能得到很大提高.与H.264/AVC相比,我们的方法能够显著提高编码视频的质量,平均PSNR能够提高0.41dB至8.76dB,与此同时,平均码率减小比例能够达到1.04%至77.81%.特别是对一类规则动态纹理视频,我们的方法能够以极低码率,得到视觉效果非常好的编码视频.实验结果还表明,对于高阶张量,使用迭代秩1分解,很难获得一个好的紧凑表示.5.人群图像序列是一类特殊的动态纹理,针对人群密度估计这一应用,研究基于高阶张量分析的方法.首先,提出一种基于高阶奇异值分解构造张量主子空间标准正交基的方法.然后,提出两个基于张量主子空间特征的人群密度估计方法.提出的方法能够保持人群数据的自然结构,从而能够对人群特征进行有效刻画,其类别表征能力很强.实验结果表明,我们的方法明显优于基于灰度共生矩阵和基于小波变换的方法,其正确率能够达到96.83%,提高12%左右,且误分类图像基本集中在邻近类别.
|
全文目录
摘要 4-6 Abstract 6-8 目录 8-10 1 绪论 10-18 1.1 研究背景与意义 10-11 1.2 研究现状与进展 11-15 1.2.1 张量分析方法 12-14 1.2.2 动态纹理方法 14-15 1.3 本文工作 15-16 1.4 本文结构 16-18 2 张量与张量分解 18-28 2.1 张量及其基本运算 18-23 2.1.1 张量概念 18-21 2.1.2 张量基本运算 21-22 2.1.3 张量的秩 22-23 2.2 张量分解 23-27 2.2.1 CP分解 24-25 2.2.2 Tucker分解 25-27 2.3 本章小结 27-28 3 动态纹理的张量模型 28-38 3.1 线性动态纹理模型 28-29 3.2 张量动态纹理模型 29-30 3.3 张量动态纹理参数估计 30-33 3.4 应用与实验 33-37 3.5 本章小结 37-38 4 动态纹理的紧凑表示和编码 38-52 4.1 紧凑表示的概念 38 4.2 张量多次秩R分解紧凑表示方法 38-42 4.3 在动态纹理编码中的应用 42-46 4.3.1 算法终止准则 43-44 4.3.2 数据重排策略 44-45 4.3.3 量化与编码 45 4.3.4 时间复杂度分析 45-46 4.4 实验分析与结果 46-51 4.4.1 与H.264/AVC的比较实验与结果 46-49 4.4.2 与TROD算法的比较实验与结果 49-51 4.5 本章小结 51-52 5 高阶张量分析在人群密度估计中的应用 52-64 5.1 人群密度估计方法概述 52-53 5.2 标准正交基张量 53-55 5.3 基于张量主子空间特征的人群密度估计方法 55-60 5.3.1 图像预处理 55 5.3.2 基于张量主子空间投影的方法 55-56 5.3.3 基于张量主子空间投影和支持向量机的方法 56-59 5.3.4 时间复杂度分析 59-60 5.4 实验分析与结果 60-62 5.5 本章小结 62-64 6 结论与展望 64-66 参考文献 66-74 致谢 74-76 攻读博士学位期间科研成果 76-77
|
相似论文
- 基于分布式视频编码错误消除机制的研究与实现,TN919.81
- 基于支持向量机的基因表达数据降维方法的研究,TP181
- 高效三维视频表达及编码技术研究与开发,TN919.81
- 面向窄带通信的视频编码技术研究,TN919.81
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
- 新一代流媒体HLS关键技术研究及实现,TN919.8
- 社会标签推荐张量分解方法研究,TP393.09
- 动态场景下基于空时显著性的运动目标检测研究,TP391.41
- 多标准离散余弦变换算法及VLSI体系研究与实现,TN47
- 虚拟人运动合成技术及其工程应用研究,TP391.41
- 基于小波变换的动态纹理分类,TN911.7
- 智能监控若干技术研究,TP277
- 基于局部线性分析的降维算法研究,TP301.6
- 基于动态纹理的森林烟雾检测技术研究与实现,TP391.41
- 基于数据挖掘技术的智能视频监控异常分析方法研究,TP391.41
- 基于DSP的视频压缩编码与实现,TN919.81
- 多视点视频编码技术研究,TN919.81
- 多描述图像与视频编码的研究,TN919.81
- 基于空时马尔可夫场的动态纹理分割,TP391.41
- 基于振动信号的高速铁路伤损探测方法,TN911.23
- 多维正弦信号参数估计算法研究,TN911.7
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|