学位论文 > 优秀研究生学位论文题录展示

光学公式识别技术研究

作 者: 田学东
导 师: 哈明虎
学 校: 河北大学
专 业: 光学工程
关键词: 光学字符识别 光学公式识别 公式符号切分 公式符号识别 公式结构分析 公式重构 跳转函数
分类号: TP391.41
类 型: 博士论文
年 份: 2007年
下 载: 57次
引 用: 0次
阅 读: 论文下载
 

内容摘要


光学公式识别技术作为将印刷体数学公式自动输入计算机的有效手段,可以弥补现有光学字符识别系统难以识别数学公式的不足,促进科技文献的数字化。本文针对光学公式识别这一有别于普通文本的二维模式识别、分析与重构问题的关键技术展开研究,包括公式字符与符号的切分与识别、公式结构分析与理解和公式重构等三个方面。主要工作如下:1.面向公式识别的需要,设计了对公式图像进行噪声去除、二值化、倾斜和变形校正的预处理方案,以改善识别性能。实验表明了该方案的有效性。2.针对与普通文本有很大差别的二维公式符号的切分问题,提出基于组合策略的公式符号自组织反馈切分算法,在切分过程中,根据识别情况对部件或符号进行合并或切分操作。针对符号粘连问题,通过对纵向粘连情况的归纳,提出基于符号知识的公式符号纵向粘连切分方法,对其进行智能切分,并设计了斜向和横向粘连符号的切分算法;融入“基于整体”的切分方法,对常见粘连符号,建立整体识别字典进行识别。实验结果表明,该方法具有较高的准确性。3.在公式符号识别中,在定义符号图像跳转函数表示法的基础上,提出基于跳转函数的方向线素特征快速提取方法,避免了耗时的轮廓提取操作,并设计了层次结构的公式符号识别器,有效地提高了符号识别的准确率和效率。4.在公式结构分析中,根据公式特点,提出融入几何信息的公式符号最大匹配分词算法,提高了符号串提取的准确性;针对传统结构分析方法存在的问题,提出基于语义的主基线定位方法,根据符号语义对符号关系进行智能分析以得到正确的基准符号;提出符号功能的模糊分类方法,将模糊逻辑应用于符号功能分析中,以适应公式在利用符号空间关系表达隐性运算关系时所存在的不确定性;提出动态的符号基线归属判别方法,根据符号综合特征判断其基线归属。上述改进措施提高了结构分析的准确性和适应性。5.在公式重构中,提出智能匹配的公式重构算法,根据所处理公式的特点选择LaTeX参数,实现了公式的准确重构。

全文目录


摘要  4-5
Abstract  5-10
第1章 引言  10-20
  1.1 研究背景及意义  10-12
  1.2 国内外研究现状及分析  12-17
  1.3 研究内容  17-18
  1.4 组织结构  18-20
第2章 光学公式识别技术  20-29
  2.1 光学公式识别技术的定义  20-21
  2.2 光学公式识别技术的内容  21-25
  2.3 光学公式识别技术有待解决的问题  25-28
  2.4 小结  28-29
第3章 公式图像的识别预处理  29-47
  3.1 公式图像噪声的去除  29-36
    3.1.1 图像去噪的光学原理  32-33
    3.1.2 图像去噪方法综述  33
    3.1.3 面向公式图像的去噪方法  33-36
  3.2 公式图像的二值化  36-39
  3.3 公式图像倾斜变形的校正  39-46
    3.3.1 公式图像的倾斜校正  40-45
    3.3.2 公式图像的变形校正  45-46
  3.4 小结  46-47
第4章 公式符号识别  47-82
  4.1 公式符号切分  48-65
    4.1.1 公式符号切分概述  48-52
    4.1.2 公式符号切分算法  52-65
  4.2 公式符号识别  65-78
    4.2.1 公式符号识别概述  65-66
    4.2.2 符号识别的对象与策略  66-67
    4.2.3 符号图像的规范化  67-69
    4.2.4 符号特征的选择与提取  69-73
    4.2.5 识别器设计  73-78
  4.3 公式图像光学采集参数的选择  78-80
  4.4 小结  80-82
第5章 公式结构分析  82-117
  5.1 公式结构的相关知识  82-83
  5.2 公式结构分析概述  83-87
  5.3 改进的公式结构分析算法  87-115
    5.3.1 结构分析的接口参数  88
    5.3.2 公式的词法分析  88-93
    5.3.3 公式结构分析算法的改进  93-115
  5.4 小结  115-117
第6章 公式重构  117-126
  6.1 重构的目标  117
  6.2 重构文件格式的选择  117-119
  6.3 智能匹配的公式重构算法  119-125
    6.3.1 LaTeX文档规范  119-120
    6.3.2 基本的重构算法  120-121
    6.3.3 重构过程中的智能处理  121-125
  6.4 小结  125-126
第7章 实验结果及分析  126-131
  7.1 样张的选择与分类  126-127
  7.2 公式符号识别的实验结果与分析  127-128
  7.3 公式结构分析的实验结果与分析  128-129
  7.4 公式识别总体实验与分析  129-130
  7.5 小结  130-131
第8章 结论与展望  131-135
  8.1 结论  131-132
  8.2 展望  132-135
参考文献  135-145
攻读博士学位期间科研工作情况  145-148
致谢  148-150

相似论文

  1. 印刷体数学公式特殊结构的分析与重构,TP391.4
  2. 基于支撑笔画的视觉文档图像透视失真校正,TP391.41
  3. 基于视频和DSP的车辆识别测速系统,TP29
  4. 基于非OCR的车牌识别系统,TP391.41
  5. 基于虚拟仪器的芯片识别系统研究,TP391.41
  6. 汽车轮毂型号自动识别系统,TP391.41
  7. 指数型Radon变换的反演及其调和分析方法研究,O174
  8. 基于Gabor理论的脱机手写汉字识别,TP391.43
  9. 印刷体数学表达式定位技术研究,TP391.41
  10. 复杂的中文文档图像版面分析研究,TP391.41
  11. OCR图像采集参数自动选择的研究,TP391.41
  12. 数学表达式结构分析的后处理研究,TP391.4
  13. 英文科技文档中数学公式的定位、识别与重建,TP391.43
  14. 印刷体数学公式识别系统的设计与实现,TP391.4
  15. 汽车牌照识别系统的研究与初步实现,TP391.41
  16. 脱机手写阿拉伯文切分算法及多队列基元合并模型,TP391.1
  17. 基于人工神经网络的光学字符识别系统及硬件实现,TP391.4
  18. 基于机器视觉的字符识别技术研究,TP391.41
  19. 印刷体数学公式识别的研究,TP391.1
  20. 基于主动学习SVM的字符识别方法研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com