学位论文 > 优秀研究生学位论文题录展示
印刷体蒙古文字识别中关键技术的研究
作 者: 魏宏喜
导 师: 高光来
学 校: 内蒙古大学
专 业: 计算机软件与理论
关键词: 蒙古文字识别 倾斜检测 倾斜校正 版面分析 字母切分 特征匹配
分类号: TP391.43
类 型: 硕士论文
年 份: 2006年
下 载: 187次
引 用: 3次
阅 读: 论文下载
内容摘要
蒙文输入法的研究开始于上世纪八十年代初期,主要集中在键盘输入上,对蒙文文字识别的研究非常少。针对这种情况,我们提出研制一套多字体印刷蒙文识别系统,为蒙文提供了一种快速、高效、智能的输入方式,这对继承和发展少数民族文化、促进少数民族地区社会进步都具有十分重要的意义。本文在总结前人研究成果的基础上,进行了诸多改进和创新。主要研究内容包括: 1、蒙文文本图像的自动倾斜检测。提出了一种基于最小二乘法的蒙文文本图像的倾斜检测方法:先找到图像中的文字连通域,然后依据连通域的上下位置进行文字列的合并;对同一列中的每个连通域以它们的质心为参考点,使用最小二乘法进行直线拟合,可以得到倾斜角度。 2、蒙文文本图像的版面分析。提出了一种基于连通域的蒙文文本图像的版面分析方法,它是一种“自底向上”与“自顶向下”相结合的方法,先搜索版面中的连通域,然后依据连通域的大小进行聚类分析,可以得到不同类型的版面元素,最后把文字连通域合并成文字列和文字块。 3、蒙文字母切分方法的研究与实现。提出了一种基于主干线的蒙文字母切分方法,为进行特征提取和特征匹配提供前提条件。 4、蒙古文字特征选择。在充分分析印刷体蒙古文字特点的基础上,找到了适合进行蒙文识别的多个特征,包括:粗分类特征和细分类特征。 实验证明,以上关键技术的实现,使得印刷体蒙古文字识别系统的性能和
|
全文目录
摘要 2-4 Abstract 4-6 目录 6-8 图表目录 8-9 第一章 序言 9-14 1.1 印刷体文字识别的发展及现状 9-11 1.2 印刷体蒙古文字识别技术的研究现状 11-12 1.3 本文研究的内容 12-13 1.4 本文各章内容安排 13-14 第二章 印刷体文字识别概述 14-24 2.1 文字识别技术概述 14-15 2.2 印刷体文字识别系统框图和系统构成 15-20 2.2.1 预处理 16-19 2.2.2 版面处理 19 2.2.3 文本图像行、字切分 19 2.2.4 文字特征提取 19-20 2.2.5 文字特征匹配 20 2.2.6 识别后处理 20 2.2.7 识别结果修改、编辑 20 2.3 用于印刷体文字识别的模式识别方法 20-24 2.3.1 结构模式识别方法 20-21 2.3.2 统计模式识别方法 21-22 2.3.3 统计模式识别与结构模式识别的结合 22 2.3.4 神经网络方法 22-24 第三章 印刷体蒙古文字识别中关键技术的研究 24-53 3.1 印刷体蒙古文字特点分析 24-26 3.2 印刷体蒙古文字识别原理及原理图 26-28 3.3 预处理技术 28-29 3.4 蒙文文本图像的倾斜检测与校正 29-41 3.4.1 常用的倾斜检测算法 30-33 3.4.1.1 基于投影图的方法 30-31 3.4.1.2 基于Hough变换的方法 31 3.4.1.3 基于交叉相关性方法 31-32 3.4.1.4 基于Fourier变换的方法 32 3.4.1.5 基于最近邻聚类方法 32-33 3.4.2 基于最小二乘法的蒙文文本图像的倾斜检测方法 33-38 3.4.2.1 搜索连通域 34-35 3.4.2.2 连通域分析 35-37 3.4.2.3 文字连通域合并成文字列 37 3.4.2.4 最小二乘法拟合直线 37-38 3.4.2.5 得到文本图像的倾斜角度 38 3.4.3 倾斜校正 38-40 3.4.4 实验数据 40 3.4.5 小结 40-41 3.5 蒙文文本图像的版面分析 41-47 3.5.1 版面分析在国内、国外发展概况 41-42 3.5.2 版面分析的技术路线 42-43 3.5.2.1 自顶向下法 42 3.5.2.2 自底向上法 42-43 3.5.2.3 综合法 43 3.5.3 蒙文版面的特点 43-44 3.5.4 基于连通域的蒙文版面分析方法 44-45 3.5.4.1 搜索连通域 44 3.5.4.2 得到完整的连通域 44 3.5.4.3 连通域分析 44-45 3.5.4.4 文字连通域合并成文字列 45 3.5.4.5 段落划分 45 3.5.5 实验数据与结论 45-47 3.6 行、字切分技术 47-49 3.6.1 行切分 47-48 3.6.2 字切分 48-49 3.7 字母切分技术 49-50 3.8 特征选择 50-52 3.8.1 粗分类特征 50-51 3.8.2 细分类特征 51-52 3.9 特征提取和特征匹配 52-53 第四章 多字体印刷体蒙古文字识别系统的实现和相关实验数据 53-57 4.1 系统实现 53 4.2 系统界面 53-54 4.3 蒙文编辑器 54-55 4.4 实验数据与小结 55-57 第五章 总结与展望 57-59 5.1 总结 57 5.2 展望 57-59 致谢 59-60 参考文献 60-64
|
相似论文
- 基于DSP的单目视觉定位方法关键技术研究,TP391.41
- 非重叠监控摄像机中行人关联技术研究,TP391.41
- 联机手写维吾尔文单词识别关键技术研究,TP391.43
- 光笔测量三维建模技术研究,TP391.41
- 文档图像的版面分析技术研究,TP391.41
- 基于DSM的遥感影像拼接关键技术研究,TP751
- 基于OCR的支票识别系统的研究与实现,TP391.41
- 彩色图像车牌提取技术研究,TP391.41
- 基于图像处理的丝印质量监控系统,TP391.41
- 基于局域网的计算机蠕虫检测技术研究与实现,TP393.08
- 基于复杂度的自适应中文版面分析方法研究,TP391.1
- 车牌识别系统的主要技术研究,TP391.41
- 车牌自动识别算法的研究与实现,TP391.41
- HHT端点问题抑制方法的研究,TN911.7
- 基于机器视觉的饮料灌装后杂质检测系统的研究与设计,TP274
- 钻孔内壁图像测量系统研究,TP391.41
- 基于VxWorks的水下目标检测识别系统实现,TP242.6
- 基于特征匹配的网络应用识别技术研究,TP393.06
- 文本图像中Logo检测与识别技术的研究,TP391.41
- 基于SURF的主动视觉跟踪技术的研究,TP391.41
- 新型指纹识别系统的设计,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com
|