学位论文 > 优秀研究生学位论文题录展示

拓扑结构特征提取及其在脱机手写数学符号识别中的研究与应用

作 者: 杨金伟
导 师: 段会川
学 校: 山东师范大学
专 业: 计算机软件与理论
关键词: 手写数学符号识别 预处理 特征提取 分类树
分类号: TP391.43
类 型: 硕士论文
年 份: 2009年
下 载: 112次
引 用: 1次
阅 读: 论文下载
 

内容摘要


文字是人类信息交流的主要载体之一。随着计算机信息技术的高速发展,使用计算机处理并识别文字信息也就成为了一个非常重要的研究和应用领域。光学字符识别OCR(Optical Character Recognition)是在20世纪逐步发展起来的一门自动化技术。脱机手写体字符识别是模式识别的一个重要分支,它涉及人工智能、图像处理、信息论、数字信号处理、模糊数学、计算机等学科,是一门综合性技术。在信息处理、机器翻译、办公自动化、人工智能等高技术领域,都有着重要的实用价值和理论意义。需要录入到计算机中的非纯文本信息是各种各样的,如大规模的原始数据资料、税务单据、会计凭证、金融票据、传统信件以及学生试卷等。如果采用手工输入的方式,就会显得非常麻烦而且工作效率非常低。尽管识别文字及数字的OCR技术已经非常实用,但数学符号的识别仍然不够理想。而数学符号对科学研究人员、数学工作者乃至普通大众都是很重要的。针对这一问题,本文进行了必要的分析,分别将脱机手写数字和脱机希腊字母进行了预处理并自主建立了手写数学符号样本库,然后对其进行了特征提取以及分类识别实验。本文对手写数学符号识别技术进行了研究和探讨,试图寻找属于某种范围的(比如:学生试卷学号、日期以及数学试卷中最常见的希腊字母,MNIST手写数字库)特征提取以达到很高的识别率。提出了一种通过拓扑特征构造来进行特征提取的方法。该方法以图像预处理为基础,最后采用分类树的方法进行识别分类。在特征提取方面,本文提出了一种拓扑结构构造方法,对数学符号构造了拓扑特征。人类字符认知的常识表明,拓扑结构在字符尤其是单个字符的辨识中起着首要的决定性的作用。由于原始图像所含对象本身的拓扑结构所包含的信息是很有限的,不能够反映出对象或其某些部位的弯曲方向、程度、分支关系等特征,而这些特征对于区分对象来说又是非常关键的。为此,本文提出如下的图像对象拓扑构造方法:在原始图像对象的某一侧或某几侧增加几列或几行像素,这些新增加的像素与原来的图像对象构成了新的拓扑结构,然后通过对新拓扑结构的连通区域的计数与位置计算获得识别特征。这些新构成的拓扑结构所含的连通(环状)区域能够体现出对象或其某些部位的弯曲方向、程度、分支关系等特征,从而可以为分类和识别提供有价值的依据。在预处理方面,本文用采集来的本科学生试卷的学号和日期以及学生高等数学试卷中的最常用的希腊字母作为样本,对其采用了传统的预处理过程,包括图像的灰度化、单字符切分、二值化、字符平滑、去除干扰、单字符归一化。最后将预处理后的字符图像仿照MNIST手写数字库建立了一个手写数学符号库,其中留有与MNIST手写库同样的边缘背景。分类识别采用了分类树的方法。实验表明,该方法不仅运算速度较快,而且分类效果好。识别系统对自主采集建立的手写数学符号图形库进行了分类识别实验,手写数字最好识别率为93.5%,误识率为6.0%,拒识率为0.5%,手写希腊字母最好识别率为93.7%,误识率为5.4%,拒识率为0.9%。实验表明,我们所提出的方法有较好的可行性,并得到了较高的辨识率。

全文目录


摘要  6-8
ABSTRACT  8-11
第一章 绪论  11-15
  1.1 引言  11-12
  1.2 国内外手写数学符号研究的历史和现状  12-13
  1.3 本文的研究范围  13
  1.4 脱机手写字符识别流程  13-14
  1.5 论文的组织结构  14-15
第二章 字符识别的方法概述  15-27
  2.1 引言  15-16
  2.2 结构识别方法  16-17
    2.2.1 结构基元的提取方法  16-17
  2.3 统计识别方法  17-20
  2.4 神经网络模式识别方法  20-24
    2.4.1 BP 神经网络及其结构  22
    2.4.2 BP 网络学习规则  22-24
  2.5 分类树识别方法  24-25
    2.5.1 分类树原理  25
  2.6 小结  25-27
第三章 预处理技术  27-33
  3.1 引言  27
  3.2 字符切分  27-28
  3.3 灰度化  28
  3.4 字符图像二值化  28-29
    3.4.1 常用的图像二值化方法  28-29
  3.5 去除干扰和平滑  29-30
    3.5.1 Unger 平滑  29-30
    3.5.2 求取字符图像最大外接矩形消除噪声块  30
  3.6 字符图像归一化  30-31
  3.7 建立学生手写数学符号库  31-33
第四章 特征提取  33-40
  4.1 引言  33-34
  4.2 拓扑结构介绍  34
  4.3 拓扑特征构造方法概述  34-35
  4.4 手写数字的拓扑特征构造  35-37
  4.5 手写希腊字母的拓扑特征构造  37-40
第五章 分类树设计  40-45
  5.1 手写数字识别的分类树设计  40-41
  5.2 手写希腊字母的分类树设计  41-43
  5.3 实验结果分析  43-45
第六章 总结  45-47
  6.1 论文的主要研究内容  45-46
  6.2 进一步的工作展望  46-47
参考文献  47-50
攻读硕士学位期间发表的论文  50-51
致谢  51

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 舌图像中瘀斑瘀点检测技术研究,TP391.41
  8. 空间交会接近视觉测量方法研究,TP391.41
  9. 图像实时采集、存储与处理方法研究,TP391.41
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 多币种纸币处理技术的研究与实现,TP391.41
  12. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  13. 基于图像的路面破损识别,TP391.41
  14. 移动机器人视觉检测和跟踪研究,TP242.62
  15. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  16. Cu2+/Co2+催化漂白桉木浆工艺与机理研究,TS745
  17. 基于随机森林的植物抗性基因识别方法研究,Q943
  18. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  19. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  20. 离子液体预处理纤维素及再生纤维素水解研究,TQ352.1
  21. 羊绒与羊毛纤维鉴别系统的研究,TS101.921

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com