学位论文 > 优秀研究生学位论文题录展示

印刷体蒙古文字识别中关键技术的研究

作 者: 魏宏喜
导 师: 高光来
学 校: 内蒙古大学
专 业: 计算机软件与理论
关键词: 蒙古文字识别 倾斜检测 倾斜校正 版面分析 字母切分 特征匹配
分类号: TP391.43
类 型: 硕士论文
年 份: 2006年
下 载: 187次
引 用: 3次
阅 读: 论文下载
 

内容摘要


蒙文输入法的研究开始于上世纪八十年代初期,主要集中在键盘输入上,对蒙文文字识别的研究非常少。针对这种情况,我们提出研制一套多字体印刷蒙文识别系统,为蒙文提供了一种快速、高效、智能的输入方式,这对继承和发展少数民族文化、促进少数民族地区社会进步都具有十分重要的意义。本文在总结前人研究成果的基础上,进行了诸多改进和创新。主要研究内容包括: 1、蒙文文本图像的自动倾斜检测。提出了一种基于最小二乘法的蒙文文本图像的倾斜检测方法:先找到图像中的文字连通域,然后依据连通域的上下位置进行文字列的合并;对同一列中的每个连通域以它们的质心为参考点,使用最小二乘法进行直线拟合,可以得到倾斜角度。 2、蒙文文本图像的版面分析。提出了一种基于连通域的蒙文文本图像的版面分析方法,它是一种“自底向上”与“自顶向下”相结合的方法,先搜索版面中的连通域,然后依据连通域的大小进行聚类分析,可以得到不同类型的版面元素,最后把文字连通域合并成文字列和文字块。 3、蒙文字母切分方法的研究与实现。提出了一种基于主干线的蒙文字母切分方法,为进行特征提取和特征匹配提供前提条件。 4、蒙古文字特征选择。在充分分析印刷体蒙古文字特点的基础上,找到了适合进行蒙文识别的多个特征,包括:粗分类特征和细分类特征。 实验证明,以上关键技术的实现,使得印刷体蒙古文字识别系统的性能和

全文目录


摘要  2-4
Abstract  4-6
目录  6-8
图表目录  8-9
第一章 序言  9-14
  1.1 印刷体文字识别的发展及现状  9-11
  1.2 印刷体蒙古文字识别技术的研究现状  11-12
  1.3 本文研究的内容  12-13
  1.4 本文各章内容安排  13-14
第二章 印刷体文字识别概述  14-24
  2.1 文字识别技术概述  14-15
  2.2 印刷体文字识别系统框图和系统构成  15-20
    2.2.1 预处理  16-19
    2.2.2 版面处理  19
    2.2.3 文本图像行、字切分  19
    2.2.4 文字特征提取  19-20
    2.2.5 文字特征匹配  20
    2.2.6 识别后处理  20
    2.2.7 识别结果修改、编辑  20
  2.3 用于印刷体文字识别的模式识别方法  20-24
    2.3.1 结构模式识别方法  20-21
    2.3.2 统计模式识别方法  21-22
    2.3.3 统计模式识别与结构模式识别的结合  22
    2.3.4 神经网络方法  22-24
第三章 印刷体蒙古文字识别中关键技术的研究  24-53
  3.1 印刷体蒙古文字特点分析  24-26
  3.2 印刷体蒙古文字识别原理及原理图  26-28
  3.3 预处理技术  28-29
  3.4 蒙文文本图像的倾斜检测与校正  29-41
    3.4.1 常用的倾斜检测算法  30-33
      3.4.1.1 基于投影图的方法  30-31
      3.4.1.2 基于Hough变换的方法  31
      3.4.1.3 基于交叉相关性方法  31-32
      3.4.1.4 基于Fourier变换的方法  32
      3.4.1.5 基于最近邻聚类方法  32-33
    3.4.2 基于最小二乘法的蒙文文本图像的倾斜检测方法  33-38
      3.4.2.1 搜索连通域  34-35
      3.4.2.2 连通域分析  35-37
      3.4.2.3 文字连通域合并成文字列  37
      3.4.2.4 最小二乘法拟合直线  37-38
      3.4.2.5 得到文本图像的倾斜角度  38
    3.4.3 倾斜校正  38-40
    3.4.4 实验数据  40
    3.4.5 小结  40-41
  3.5 蒙文文本图像的版面分析  41-47
    3.5.1 版面分析在国内、国外发展概况  41-42
    3.5.2 版面分析的技术路线  42-43
      3.5.2.1 自顶向下法  42
      3.5.2.2 自底向上法  42-43
      3.5.2.3 综合法  43
    3.5.3 蒙文版面的特点  43-44
    3.5.4 基于连通域的蒙文版面分析方法  44-45
      3.5.4.1 搜索连通域  44
      3.5.4.2 得到完整的连通域  44
      3.5.4.3 连通域分析  44-45
      3.5.4.4 文字连通域合并成文字列  45
      3.5.4.5 段落划分  45
    3.5.5 实验数据与结论  45-47
  3.6 行、字切分技术  47-49
    3.6.1 行切分  47-48
    3.6.2 字切分  48-49
  3.7 字母切分技术  49-50
  3.8 特征选择  50-52
    3.8.1 粗分类特征  50-51
    3.8.2 细分类特征  51-52
  3.9 特征提取和特征匹配  52-53
第四章 多字体印刷体蒙古文字识别系统的实现和相关实验数据  53-57
  4.1 系统实现  53
  4.2 系统界面  53-54
  4.3 蒙文编辑器  54-55
  4.4 实验数据与小结  55-57
第五章 总结与展望  57-59
  5.1 总结  57
  5.2 展望  57-59
致谢  59-60
参考文献  60-64

相似论文

  1. 基于DSP的单目视觉定位方法关键技术研究,TP391.41
  2. 非重叠监控摄像机中行人关联技术研究,TP391.41
  3. 联机手写维吾尔文单词识别关键技术研究,TP391.43
  4. 光笔测量三维建模技术研究,TP391.41
  5. 文档图像的版面分析技术研究,TP391.41
  6. 基于DSM的遥感影像拼接关键技术研究,TP751
  7. 基于OCR的支票识别系统的研究与实现,TP391.41
  8. 彩色图像车牌提取技术研究,TP391.41
  9. 基于图像处理的丝印质量监控系统,TP391.41
  10. 基于局域网的计算机蠕虫检测技术研究与实现,TP393.08
  11. 基于复杂度的自适应中文版面分析方法研究,TP391.1
  12. 车牌识别系统的主要技术研究,TP391.41
  13. 车牌自动识别算法的研究与实现,TP391.41
  14. HHT端点问题抑制方法的研究,TN911.7
  15. 基于机器视觉的饮料灌装后杂质检测系统的研究与设计,TP274
  16. 钻孔内壁图像测量系统研究,TP391.41
  17. 基于VxWorks的水下目标检测识别系统实现,TP242.6
  18. 基于特征匹配的网络应用识别技术研究,TP393.06
  19. 文本图像中Logo检测与识别技术的研究,TP391.41
  20. 基于SURF的主动视觉跟踪技术的研究,TP391.41
  21. 新型指纹识别系统的设计,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com