学位论文 > 优秀研究生学位论文题录展示
电子阅读笔中图像预处理及帧间配准的研究与实现
作 者: 刘伟
导 师: 林嘉宇
学 校: 国防科学技术大学
专 业: 信息与通信工程
关键词: 电子阅读笔 移动扫描 文字识别 图像预处理 二值化 倾斜校正 行切分 图像配准
分类号: TP391.41
类 型: 硕士论文
年 份: 2007年
下 载: 46次
引 用: 3次
阅 读: 论文下载
内容摘要
图像的预处理及帧间配准是基于移动扫描光学字符识别(OCR)的电子阅读笔的核心技术。本文构建了完整的针对移动扫描图像的前端处理算法模块,对其中各环节的算法进行了研究和实现。论文的具体工作如下:1、解析了AVI视频文件和BMP位图文件的格式,实现了AVI视频文件中各单帧图像的提取、RGB图像向灰度图像的转换、配准后的拼接图像保存为BMP格式等模块,为进一步的研究工作提供了良好的实验手段。2、在文本图像的二值化过程中,实现了Otsu全局阈值法和Bernsen局部阈值法;结合二者优点,实现了全局和局部阈值相结合的分步二值化方法,取得了较好的实验效果。3、实现了基于Hough变换的文字行倾斜校正算法,分析了Hough变换算法的复杂性及其对倾斜角度检测失误的缺陷。采用了投影值倾斜角检测法,把整数Bresenham算法引入到投影值的计算过程中,降低了计算的复杂度;进一步,分析比较了投影值法中的最大投影值法与最大空白段法,选择了更准确、有效的倾斜角度检测准则。4、采用水平投影法实现了文本行的切分,采用双三次插值法实现不同大小的文本行图像的规格化。5、在文字图像的帧间配准及拼接环节,实现了SIFT算法、基于文字轮廓的配准算法以及投影配准算法;并提出了改进的投影配准法,提高了该方法应对图像拉伸变形的鲁棒性。论文实现了基于移动扫描OCR的电子阅读笔的前端处理算法模块,仿真实验表明,前端处理算法模块的效果良好,为电子阅读笔后端的字符识别等工作打下了坚实的基础。
|
全文目录
摘要 9-10 ABSTRACT 10-11 第一章 绪论 11-19 §1.1 OCR简介 11-13 §1.2 基于移动扫描OCR的电子阅读笔 13-16 1.2.1 OCR的发展概况 13-14 1.2.2 基于移动扫描OCR的电子阅读笔软件系统设计 14-15 1.2.3 面向电子阅读笔的OCR技术实现的难点 15-16 1.2.4 国内外现状 16 1.3 论文选题的目的和意义 16-17 §1.4 本文的主要工作及后续章节安排 17-19 第二章 视频图像处理准备工作 19-28 §2.1 数字图像处理技术基础 19-22 2.1.1 图像处理概述 19-20 2.1.2 数字图像处理的特点 20-21 2.1.3 数字图像处理的方法 21-22 §2.2 AVI文件格式 22-25 §2.3 RGB图像向灰度图像的转换 25-26 §2.4 BMP位图文件格式 26-27 §2.5 本章小结 27-28 第三章 文字图像的预处理 28-48 §3.2 图像的二值化 28-34 3.2.1 Otsu算法 29-30 3.2.2 Bernsen局部阈值方法 30-32 3.2.3 全局和局部相结合的二值化方法 32-34 §3.3 文本倾斜校正 34-44 3.3.1 Hough变换法 35-38 3.3.2 基于整数Bresenham算法的投影法 38-43 3.3.3 平滑去噪 43-44 §3.4 行切分及图像规格化 44-47 3.4.1 行切分 44-46 3.4.2 图像规格化处理 46-47 §3.5 本章小结 47-48 第四章 文本行图像的帧间配准与拼接 48-60 §4.1 图像配准概述 48-50 4.1.1 图像配准的原理 48 4.1.2 图像配准的方法 48-50 §4.2 SIFT算法 50-55 4.2.1 图像多尺度表示 50 4.2.2 SIFT特征匹配算法 50-54 4.2.3 图像拼接及效果 54-55 §4.3 基于文字轮廓的配准算法 55-57 §4.4 投影配准法 57-59 4.4.1 投影配准的原理及实现 57-58 4.4.2 改进的投影配准方法 58-59 §4.5 本章小结 59-60 第五章 总结 60-63 致谢 63-64 参考文献 64-67 攻读硕士期间发表的论文 67
|
相似论文
- 图像拼接技术研究,TP391.41
- 舌图像中瘀斑瘀点检测技术研究,TP391.41
- 机器人自动巡检系统中图像配准与图像匹配问题的研究,TP242.62
- 结合线性二次放射生物模型的图像配准技术的研究,R815
- 红外图像目标识别及跟踪技术研究,TP391.41
- 车牌识别系统中车牌定位算法的研究,TP391.41
- 基于改进光流场模型的医学图像非刚性配准算法研究及实现,TP391.41
- 非刚性医学图像准算法研究和实现,TP391.41
- 基于车牌识别技术的智能交通系统的设计与实现,TP391.41
- 基于SVM的车牌字符识别算法研究与实现,TP391.41
- 基于图形处理器的SIFT算法研究,TP391.41
- 实时视频拼接系统关键技术研究,TP391.41
- 应用于窄间隙埋弧焊的图像采集及预处理系统研究,TG445
- 工业应用中的目标检测与精确定位技术,TP391.41
- POCS图像超分辨率重建技术研究,TP391.41
- 混纺织物不同纤维的图像识别与定量分析,TP391.41
- 医学图像配准平台及结合灰度与几何信息的新配准测度,TP391.41
- 艺术肖像剪纸生成及其心理认知评价,TP391.41
- 人脸特征点自动标注及表情生成,TP391.41
- 红外与可见光图像配准及融合技术的研究,TP391.41
- 基于数字图像处理的电能表图像识别技术研究与实现,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|