学位论文 > 优秀研究生学位论文题录展示

电子阅读笔中图像预处理及帧间配准的研究与实现

作 者: 刘伟
导 师: 林嘉宇
学 校: 国防科学技术大学
专 业: 信息与通信工程
关键词: 电子阅读笔 移动扫描 文字识别 图像预处理 二值化 倾斜校正 行切分 图像配准
分类号: TP391.41
类 型: 硕士论文
年 份: 2007年
下 载: 46次
引 用: 3次
阅 读: 论文下载
 

内容摘要


图像的预处理及帧间配准是基于移动扫描光学字符识别(OCR)的电子阅读笔的核心技术。本文构建了完整的针对移动扫描图像的前端处理算法模块,对其中各环节的算法进行了研究和实现。论文的具体工作如下:1、解析了AVI视频文件和BMP位图文件的格式,实现了AVI视频文件中各单帧图像的提取、RGB图像向灰度图像的转换、配准后的拼接图像保存为BMP格式等模块,为进一步的研究工作提供了良好的实验手段。2、在文本图像的二值化过程中,实现了Otsu全局阈值法和Bernsen局部阈值法;结合二者优点,实现了全局和局部阈值相结合的分步二值化方法,取得了较好的实验效果。3、实现了基于Hough变换的文字行倾斜校正算法,分析了Hough变换算法的复杂性及其对倾斜角度检测失误的缺陷。采用了投影值倾斜角检测法,把整数Bresenham算法引入到投影值的计算过程中,降低了计算的复杂度;进一步,分析比较了投影值法中的最大投影值法与最大空白段法,选择了更准确、有效的倾斜角度检测准则。4、采用水平投影法实现了文本行的切分,采用双三次插值法实现不同大小的文本行图像的规格化。5、在文字图像的帧间配准及拼接环节,实现了SIFT算法、基于文字轮廓的配准算法以及投影配准算法;并提出了改进的投影配准法,提高了该方法应对图像拉伸变形的鲁棒性。论文实现了基于移动扫描OCR的电子阅读笔的前端处理算法模块,仿真实验表明,前端处理算法模块的效果良好,为电子阅读笔后端的字符识别等工作打下了坚实的基础。

全文目录


摘要  9-10
ABSTRACT  10-11
第一章 绪论  11-19
  §1.1 OCR简介  11-13
  §1.2 基于移动扫描OCR的电子阅读笔  13-16
    1.2.1 OCR的发展概况  13-14
    1.2.2 基于移动扫描OCR的电子阅读笔软件系统设计  14-15
    1.2.3 面向电子阅读笔的OCR技术实现的难点  15-16
    1.2.4 国内外现状  16
  1.3 论文选题的目的和意义  16-17
  §1.4 本文的主要工作及后续章节安排  17-19
第二章 视频图像处理准备工作  19-28
  §2.1 数字图像处理技术基础  19-22
    2.1.1 图像处理概述  19-20
    2.1.2 数字图像处理的特点  20-21
    2.1.3 数字图像处理的方法  21-22
  §2.2 AVI文件格式  22-25
  §2.3 RGB图像向灰度图像的转换  25-26
  §2.4 BMP位图文件格式  26-27
  §2.5 本章小结  27-28
第三章 文字图像的预处理  28-48
  §3.2 图像的二值化  28-34
    3.2.1 Otsu算法  29-30
    3.2.2 Bernsen局部阈值方法  30-32
    3.2.3 全局和局部相结合的二值化方法  32-34
  §3.3 文本倾斜校正  34-44
    3.3.1 Hough变换法  35-38
    3.3.2 基于整数Bresenham算法的投影法  38-43
    3.3.3 平滑去噪  43-44
  §3.4 行切分及图像规格化  44-47
    3.4.1 行切分  44-46
    3.4.2 图像规格化处理  46-47
  §3.5 本章小结  47-48
第四章 文本行图像的帧间配准与拼接  48-60
  §4.1 图像配准概述  48-50
    4.1.1 图像配准的原理  48
    4.1.2 图像配准的方法  48-50
  §4.2 SIFT算法  50-55
    4.2.1 图像多尺度表示  50
    4.2.2 SIFT特征匹配算法  50-54
    4.2.3 图像拼接及效果  54-55
  §4.3 基于文字轮廓的配准算法  55-57
  §4.4 投影配准法  57-59
    4.4.1 投影配准的原理及实现  57-58
    4.4.2 改进的投影配准方法  58-59
  §4.5 本章小结  59-60
第五章 总结  60-63
致谢  63-64
参考文献  64-67
攻读硕士期间发表的论文  67

相似论文

  1. 图像拼接技术研究,TP391.41
  2. 舌图像中瘀斑瘀点检测技术研究,TP391.41
  3. 机器人自动巡检系统中图像配准与图像匹配问题的研究,TP242.62
  4. 结合线性二次放射生物模型的图像配准技术的研究,R815
  5. 红外图像目标识别及跟踪技术研究,TP391.41
  6. 车牌识别系统中车牌定位算法的研究,TP391.41
  7. 基于改进光流场模型的医学图像非刚性配准算法研究及实现,TP391.41
  8. 非刚性医学图像准算法研究和实现,TP391.41
  9. 基于车牌识别技术的智能交通系统的设计与实现,TP391.41
  10. 基于SVM的车牌字符识别算法研究与实现,TP391.41
  11. 基于图形处理器的SIFT算法研究,TP391.41
  12. 实时视频拼接系统关键技术研究,TP391.41
  13. 应用于窄间隙埋弧焊的图像采集及预处理系统研究,TG445
  14. 工业应用中的目标检测与精确定位技术,TP391.41
  15. POCS图像超分辨率重建技术研究,TP391.41
  16. 混纺织物不同纤维的图像识别与定量分析,TP391.41
  17. 医学图像配准平台及结合灰度与几何信息的新配准测度,TP391.41
  18. 艺术肖像剪纸生成及其心理认知评价,TP391.41
  19. 人脸特征点自动标注及表情生成,TP391.41
  20. 红外与可见光图像配准及融合技术的研究,TP391.41
  21. 基于数字图像处理的电能表图像识别技术研究与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com