学位论文 > 优秀研究生学位论文题录展示
辅助虚拟布景的视频字幕实时分离系统设计与实现
作 者: 王宏松
导 师: 祝永新;杨莉;贾松仁
学 校: 上海交通大学
专 业: 软件工程
关键词: 虚拟布景 视频字幕 分离 实时 图象处理
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 4次
引 用: 0次
阅 读: 论文下载
内容摘要
对视频字幕的处理在不同的应用环境中有不同的要求。在视频检索系统中,字幕的分割、提取和识别都是基于软件的,算法都是在软件环境中实现的。软件系统具有成本低、易于维护的优点。它的缺点是实时性不好,尤其是有的算法本身决定了无法到达视频实时输出的处理要求;而且由于运行软件的平台是通用计算机,通常具有许多附加的强大功能但实际当中并不使用,因此造成资源浪费,使成本提高。随着多媒体应用技术的发展和网速时代的来临,每天都会出现大量的视频内容。人们面对海量内容的视频信息需要更快速地甚至实时地处理。集成电路产业的飞速发展,使新的技术工艺逐步成熟,器件集成度更高、速度更快、成本更低,许多以前不易在硬件上实现的算法,现在可以轻松实现了,而且具有成本低、可靠性高、速度快等优点。因此,本文根据目前视频字幕检索技术的基本原理和基本思想,提出了一种视频字幕的实时分离算法,并在软件进行算法验证的基础上,设计出了一个基于硬件实现的KTV实时视频字幕分离系统。该系统采用数字视频编解码芯片和可编程逻辑器件,使算法在硬件基础上设计实现,可解决数字视频处理的速度问题和可靠性的问题。首先,研究了视频字幕的分割算法和背景修复算法。针对具体的应用背景,对KTV视频字幕的特点进行了分析,然后对现有的视频字幕分割提取算法进行分析、比较,提出易于硬件实现、速度较快的一些算法,并在软件环境下进行了验证、仿真,以保证算法的正确和有效。然后设计了硬件系统,包括系统整体结构设计、电路设计和印制电路板设计。根据功能需求,在整体上考虑硬件系统各个部分的组成和结构,定义了每个部分相应的功能规范。在电路设计中,兼顾较新的技术实现和较低的成本考虑,进行器件选型、电路结构的设计。在印制电路板的设计中考虑了设计规则的定义、元件布局、布线原则、规则检查和原理图对比,还有电路调试的基本手段说明。最后在硬件系统上对算法进行了功能实现。在规格制定中,明确了系统功能和基本的性能指标,然后定义了功能模块以及模块之间的接口。在硬件描述语言的设计中,考虑了数字视频信号的特点,在兼顾速度的同时降低了逻辑电路的复杂度,控制了设计面积。在调试后期,与数字色键合成系统进行了联机应用测试,效果令人满意,达到了设计的要求。
|
全文目录
摘要 5-7 ABSTRACT 7-12 符号与标记 12-13 第一章 绪论 13-21 1.1 引言 13 1.2 虚拟布景的视频合成系统介绍 13-15 1.3 国内外视频检索及其应用的研究现状 15-19 1.3.1 字幕检测 15-16 1.3.2 字幕提取 16-17 1.3.3 文字识别 17-18 1.3.4 视频检索应用 18 1.3.5 与字幕处理相关的图像技术 18-19 1.4 本文的主要内容和论文结构 19-20 1.5 本章小结 20-21 第二章 算法研究 21-29 2.1 KTV 视频字幕的特点 21 2.2 算法的基本思路 21 2.3 软件环境下的验证 21-28 2.3.1 标记含字幕的帧 22-23 2.3.2 记录字幕行的位置 23-25 2.3.3 标记字幕文字的区域 25-26 2.3.4 文字与背景的分割 26-27 2.3.5 字幕修复处理 27-28 2.4 本章小结 28-29 第三章、硬件系统设计 29-43 3.1 系统框图 29-30 3.2 主要器件的选型 30-31 3.3 电路原理图设计 31-35 3.3.1 信号输入接口 32-33 3.3.2 存储器接口 33 3.3.3 信号输出接口 33-34 3.3.4 电源电路 34-35 3.4 PCB 设计 35-39 3.4.1 设计规则 35-36 3.4.2 元件库和元件布局 36-37 3.4.3 电源区域和地平面的划分 37-39 3.4.4 布线和DRC、LVS 检查 39 3.5 电路调试和器件配置 39-41 3.5.1 MCU 编程 39-40 3.5.2 Decoder/Encoder 的配置 40-41 3.5.3 FPGA 和CPLD 的配置 41 3.6 本章小结 41-43 第四章、算法的硬件实现 43-53 4.1 需要考虑的问题 43-44 4.1.1 基本功能和特性 43 4.1.2 模块的划分 43-44 4.2 视频数据流向 44-45 4.3 代码设计 45-49 4.3.1 主状态机 45-46 4.3.2 关键模块的接口定义 46-48 4.3.3 过滤模板的生成 48-49 4.4 调试过程及结果 49 4.5 实时性改进及比较 49-51 4.6 与数字色键系统结合的尝试 51-52 4.7 本章小结 52-53 第五章、全文总结 53-55 5.1 本文的主要工作 53 5.2 取得的成果及应用情况 53 5.3 本文不足之处和下一步的工作 53-55 参考文献 55-57 致谢 57-59 攻读硕士学位期间已发表或录用的论文 59-61
|
相似论文
- 附面层抽吸对扩压叶栅气动性能影响的数值研究,TH453
- 基于陀螺和星敏感器的卫星姿态确定研究,V448.2
- 缝隙式扩压叶栅流动机理研究,TK474.8
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 导弹虚拟试验可视化技术研究,TP391.9
- FPGA/DSP图像协处理技术及以太网数据传输,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- PCI-E总线高速数据采集回放模块研制,TP274.2
- 分离镜系统的滑模变结构控制及抖振抑制,TP273
- 四旋翼垂直起降机控制问题的研究,TP273
- 自适应双重控制在垂直起降机中的应用研究,TP273
- 基于windows的计算机数字控制系统实时性的研究,TG659
- 米曲霉FS-1脂肪酶发酵优化、分离纯化与酶学特性的研究,TQ925.6
- 草菇采后生理生化及保鲜方法的研究,S646.13
- 凡纳滨对虾虾头内源性蛋白酶分离纯化与酶学特性研究,S985.21
- 罗非鱼分离蛋白的制备及其性质研究,TS254.4
- 芴甲氧羰基-D-色氨酸及D-苯丙氨酸分子印迹聚合物的制备及分离性能研究,O631.3
- 雪莲果低聚果糖提取分离及分析研究,TS255.1
- 抑制植物病原菌的植物提取物筛选,S482.2
- 微生物有机肥防治土传棉花黄萎病的效果及对根际微生物影响,S144.1
- 新疆紫草细胞的稀土生物学效应及遗传转化,S567.239
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|