学位论文 > 优秀研究生学位论文题录展示

低质量印刷体字符分割与识别研究

作 者: 孙强
导 师: 娄震
学 校: 南京理工大学
专 业: 模式识别与智能系统
关键词: 印刷体 低质量 多阈值选取 二级分割 相似字符 遗传算法 二级识别
分类号: TP391.43
类 型: 硕士论文
年 份: 2014年
下 载: 27次
引 用: 0次
阅 读: 论文下载
 

内容摘要


印刷体字符识别技术发展的越来越成熟,在现代社会中的应用越来越广,但是低质量印刷体字符的识别依然是印刷体字符识别技术发展的瓶颈。本文分析了低质量印刷体字符识别过程中常遇见的问题,根据这些常出现的问题结合本文实验对象的特点和规律,设计了一个低质量印刷体字符识别流程,并通过车牌字符区域图像、人民币冠字号码区域图像作为实验对象来验证本文介绍的识别过程的有效性。二值化阈值选取算法中,本文使用了在Otsu算法获得的全局阈值的基础上,通过选取该阈值邻域内的值作为候选阈值,结合连续字符连通域分析评价准则得出的评价分数,从候选阈值出选出最优阈值。该方法主要用在字符分割中,从实验效果图和分割实验结果显示了该方法的可行性。使用单一的字符分割策略对于低质量印刷体字符的分割能力有限,在字符分割阶段,本文采用了基于字符轮廓连通域分析与投影切分相结合的两级字符分割作为字符切割的方法。通过连续若干个印刷体字符连通域分析评价准则得出的评价分数,将两种分割方法串联起来,当一级字符分割评价分数低于某个阈值时,进入二级字符分割。实验表明,单使用一级字符分割方法没有两级字符分割方法分割正确率高。低质量印刷体字符图像中存在的干扰因素,使得相似字符的识别正确率往往要比其他字符的识别正确率低。为了减少相似字符之间的混淆错误,在字符识别阶段,本文使用基于敏感区域训练的二级字符识别来区分容易出现混淆错误的相似字符对,并利用遗传算法来获取字符识别阶段所需的一级可信度阈值参数和二级可信度阈值参数。实验表明,该方法能够有效的减少相似字符对之间的混淆错误。2021张车牌字符图像经过本文介绍的方法识别正确率达到了82.1%,比使用单一策略识别方法提高了3.3%;5113张人民币冠字号码图像识别正确率达到了93.7%,比使用单一策略识别方法提高了1.5%。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-15
  1.1 研究背景与意义  9-10
  1.2 低质量印刷体字符分析  10-11
  1.3 印刷体字符OCR技术研究现状  11-12
  1.4 本文的研究内容  12-13
  1.5 本文的组织结构  13-15
2 预处理技术  15-25
  2.1 二值化  15-19
    2.1.1 本文使用到的二值化方法  15-19
      2.1.1.1 Otsu算法  15-16
      2.1.1.2 在Otsu基础上基于评价标准反馈确定二值化阈值  16-18
      2.1.1.3 基于Otsu的局部阈值二值化算法  18-19
  2.2 通过遗传算法获取最佳阈值  19-24
    2.2.1 遗传算法  20-21
    2.2.2 遗传算法流程  21-22
    2.2.3 本文具体使用过程  22-23
    2.2.4 通过实验获取最优阈值  23-24
  2.3 本章小结  24-25
3 基于字符连通域分析与投影切分相结合的两级字符分割  25-37
  3.1 引言  25
  3.2 基于字符连通域分析与投影切分相结合的两级字符分割  25-26
  3.3 字符区域上下边界的粗定位  26-28
    3.3.1 基于投影差分的字符区域上下边界的粗定位  26-28
  3.4 基于字符连通域轮廓分析的第一级字符分割  28-32
    3.4.1 基于评价标准反馈确定二值化阈值  28-29
    3.4.2 连续字符连通域轮廓分析  29-31
    3.4.3 实验效果与结果分析  31-32
  3.5 基于投影分析的第二级字符分割  32-35
    3.5.1 车牌字符分割实验中具体步骤  32-34
    3.5.2 人民币冠字号码分割实验中具体步骤  34-35
  3.6 实验结果与分析  35-36
  3.7 本章小结  36-37
4 基于相似字符敏感区域训练的二级字符识别  37-49
  4.1 引言  37
  4.2 基于敏感区域的二级字符识别算法框架  37-39
  4.3 一级分类识别  39-43
    4.3.1 一级识别特征提取  39-40
    4.3.2 一级识别分类器  40
    4.3.3 一级识别结果可靠性  40-41
    4.3.4 一级分类实验和分析  41-43
  4.4 基于敏感区域训练的二级识别  43-47
    4.4.1 相似字符的敏感区域以及提取方法  44-45
    4.4.2 二级识别算法过程  45
    4.4.3 二级识别可信度  45-46
    4.4.4 二级识别实验和分析  46-47
  4.5 整体识别实验结果与分析  47
  4.6 本章小结  47-49
5 总结与展望  49-51
致谢  51-52
参考文献  52-56
附录  56

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  4. 部队人员网上训练与考核系统的开发,TP311.52
  5. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  6. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  7. 基于遗传算法的中短波磁天线的设计及实现,TN820
  8. 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
  9. 基于油耗的城市交通信号分层递阶控制的优化研究,U491.51
  10. 基于遗传算法和Moldflow的双色成型注塑模具浇注系统最优化的研究,TQ320.52
  11. “十二五”期间能源结构优化及新能源发展对策研究,F206;F224
  12. 磁流变阻尼器的力学特性及其在火炮反后坐中的应用研究,TB535.1
  13. 基于模拟的注塑模浇注系统及成型工艺参数优化研究,TQ320.662
  14. 基于重型机床大型零件铣削加工性能及参数优化的研究,TG54
  15. 低质量竞争的困境与出路,F273.2;F224
  16. 三自由度飞行器的控制研究,V249.1
  17. 基于遗传算法的无线传感器网络优化,TN929.5
  18. 基于遗传算法智能小车路径规划的研究,TP242
  19. 纵轴式掘进机外喷雾的数值模拟与优化设计,TD714.4
  20. 三自由度飞行器模型的模糊PID控制研究,V249.1
  21. 改进和声搜索算法在车辆路径问题中的应用研究,TP301.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com