学位论文 > 优秀研究生学位论文题录展示

电子阅读笔中图像预处理及帧间配准的研究与实现

作　者: 刘伟
导　师: 林嘉宇
学　校: 国防科学技术大学
专　业: 信息与通信工程
关键词: 电子阅读笔移动扫描文字识别图像预处理二值化倾斜校正行切分图像配准
分类号: TP391.41
类　型: 硕士论文
年　份: 2007年
下　载: 46次
引　用: 3次
阅　读: 论文下载

内容摘要

图像的预处理及帧间配准是基于移动扫描光学字符识别(OCR)的电子阅读笔的核心技术。本文构建了完整的针对移动扫描图像的前端处理算法模块,对其中各环节的算法进行了研究和实现。论文的具体工作如下:1、解析了AVI视频文件和BMP位图文件的格式,实现了AVI视频文件中各单帧图像的提取、RGB图像向灰度图像的转换、配准后的拼接图像保存为BMP格式等模块,为进一步的研究工作提供了良好的实验手段。2、在文本图像的二值化过程中,实现了Otsu全局阈值法和Bernsen局部阈值法;结合二者优点,实现了全局和局部阈值相结合的分步二值化方法,取得了较好的实验效果。3、实现了基于Hough变换的文字行倾斜校正算法,分析了Hough变换算法的复杂性及其对倾斜角度检测失误的缺陷。采用了投影值倾斜角检测法,把整数Bresenham算法引入到投影值的计算过程中,降低了计算的复杂度;进一步,分析比较了投影值法中的最大投影值法与最大空白段法,选择了更准确、有效的倾斜角度检测准则。4、采用水平投影法实现了文本行的切分,采用双三次插值法实现不同大小的文本行图像的规格化。5、在文字图像的帧间配准及拼接环节,实现了SIFT算法、基于文字轮廓的配准算法以及投影配准算法;并提出了改进的投影配准法,提高了该方法应对图像拉伸变形的鲁棒性。论文实现了基于移动扫描OCR的电子阅读笔的前端处理算法模块,仿真实验表明,前端处理算法模块的效果良好,为电子阅读笔后端的字符识别等工作打下了坚实的基础。

全文目录

摘要  9-10
ABSTRACT  10-11
第一章绪论  11-19
  §1.1 OCR简介  11-13
  §1.2 基于移动扫描OCR的电子阅读笔  13-16
    1.2.1 OCR的发展概况  13-14
    1.2.2 基于移动扫描OCR的电子阅读笔软件系统设计  14-15
    1.2.3 面向电子阅读笔的OCR技术实现的难点  15-16
    1.2.4 国内外现状  16
  1.3 论文选题的目的和意义  16-17
  §1.4 本文的主要工作及后续章节安排  17-19
第二章视频图像处理准备工作  19-28
  §2.1 数字图像处理技术基础  19-22
    2.1.1 图像处理概述  19-20
    2.1.2 数字图像处理的特点  20-21
    2.1.3 数字图像处理的方法  21-22
  §2.2 AVI文件格式  22-25
  §2.3 RGB图像向灰度图像的转换  25-26
  §2.4 BMP位图文件格式  26-27
  §2.5 本章小结  27-28
第三章文字图像的预处理  28-48
  §3.2 图像的二值化  28-34
    3.2.1 Otsu算法  29-30
    3.2.2 Bernsen局部阈值方法  30-32
    3.2.3 全局和局部相结合的二值化方法  32-34
  §3.3 文本倾斜校正  34-44
    3.3.1 Hough变换法  35-38
    3.3.2 基于整数Bresenham算法的投影法  38-43
    3.3.3 平滑去噪  43-44
  §3.4 行切分及图像规格化  44-47
    3.4.1 行切分  44-46
    3.4.2 图像规格化处理  46-47
  §3.5 本章小结  47-48
第四章文本行图像的帧间配准与拼接  48-60
  §4.1 图像配准概述  48-50
    4.1.1 图像配准的原理  48
    4.1.2 图像配准的方法  48-50
  §4.2 SIFT算法  50-55
    4.2.1 图像多尺度表示  50
    4.2.2 SIFT特征匹配算法  50-54
    4.2.3 图像拼接及效果  54-55
  §4.3 基于文字轮廓的配准算法  55-57
  §4.4 投影配准法  57-59
    4.4.1 投影配准的原理及实现  57-58
    4.4.2 改进的投影配准方法  58-59
  §4.5 本章小结  59-60
第五章总结  60-63
致谢  63-64
参考文献  64-67
攻读硕士期间发表的论文  67

电子阅读笔中图像预处理及帧间配准的研究与实现

内容摘要

全文目录

相似论文