学位论文 > 优秀研究生学位论文题录展示

银行票据手写数字串识别的预处理与分割

作 者: 刘培根
导 师: 娄震
学 校: 南京理工大学
专 业: 计算机应用技术
关键词: 灰度化 去除框线 灰度梯度 倾斜矫正 粘连数字串 切割
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


票据手写数字串识别系统对银行业有非常大的实用价值。对于扫描得到的票据图像,主要处理步骤包括字符识别以及识别前的预处理与分割两大部分,现有识别算法中,单个数字字符的识别正确率高于99%,在这种情况下,提高整个数字串识别率的关键在于数字串图像的前期预处理与分割。本文以某建设银行支票中的手写数字串为背景,主要对预处理和分割过程中的一些核心技术进行研究和改进,并取得了一定的成果。主要研究内容包括:1)对彩色图像进行灰度化处理,针对图像中存在红色印章的情况,提出了适合本文的图像灰度化算法,在保留数字字符信息的情况下去除印章影响,同时对灰度图像进行增强、去噪,为后续工作打好基础。2)去除数字串的外框,主要分为框线检测与字符相交检测两部分。针对框线有些倾斜、弯曲的情况,提出了先进行直线检测,再寻找精确边缘点,最后分段进行直线拟合的方法准确描述框线。在框线与字符相交的处理过程中,提出了基于灰度梯度的交叉点检测算法,并结合字符与框线的相交形状对交叉点进行左右、上下配对,准确描述了相交部分的信息,最后在去框的过程中,对字符与框线相交的部分进行了保留。3)对数字串进行倾斜矫正,由于每个人的书写习惯不同,不少数字串是倾斜的,为了便于切分以及使数字的特征更加集中,需要进行方向上的归一化处理。对于倾斜角的计算,本文首先提出了基于数字笔画梯度方向的方法,该方法对于90%的数字串有效,对于另外的10%情况,本文又提出了基于字符框架信息的方法计算倾斜角。两种方法相辅相成,取得了很好的效果。4)切割整个数字串为单个数字字符,首先根据每个连通域的字符轮廓信息判别此连通域为单字或粘连字串,对于粘连数字串,提出了一种基于灰度图像的切分算法。算法首先根据灰度图像中,字符边缘点的梯度方向变化率准确寻找切分点,再结合切分线的类别连接切分点,计算切分可靠性,然后选择不同的切分线,生成切割组合,最后基于识别反馈的方法选择最佳切割组合。结合改进的k-近邻分类器,实现了票据手写数字串识别系统,测试1000张数字串图像(每串12个数字),识别正确率为90.2%。

全文目录


摘要  3-4
Abstract  4-6
目录  6-8
1 绪论  8-15
  1.1 金融票据OCR系统  8-9
  1.2 OCR技术与性能  9-10
  1.3 预处理与分割难点与现状  10-12
  1.4 本文研究工作概述  12-13
  1.5 本文的内容安排  13-15
2 灰度化与二值化  15-18
  2.1 图像灰度化以及去章  15-16
  2.2 Otsu二值化  16-17
  2.3 本章小结  17-18
3 框线的检测与去除  18-26
  3.1 框线的检测  18-20
    3.1.1 框线说明  18
    3.1.2 直线检测  18-19
    3.1.3 分段直线拟合  19-20
  3.2 框线的去除  20-25
    3.2.1 交叉点检测  21-22
    3.2.2 交叉点筛选配对  22-24
    3.2.3 去框与结果分析  24-25
  3.3 本章小结  25-26
4 数字串的倾斜矫正  26-34
  4.1 引言  26
  4.2 计算字串倾斜角  26-32
    4.2.1 基于梯度方向计算倾斜角  26-28
    4.2.2 基于字符框架计算倾斜角  28-32
  4.3 根据倾斜角矫正图像  32-33
  4.4 本章小结  33-34
5 数字串的切分  34-51
  5.1 引言  34
  5.2 判断数字串是否粘连  34-35
  5.3 切分粘连数字串  35-46
    5.3.1 粘连数字串说明  35-38
    5.3.2 基于灰度图像寻找切分点  38-41
    5.3.3 生成切分线  41-44
    5.3.4 产生切割组合  44-45
    5.3.5 基于识别选择最佳切分组合  45-46
  5.4 切分结果与分析  46-49
    5.4.1 k-近邻分类器  46-47
    5.4.2 切分结果与分析  47-49
  5.5 本文实验结果与分析  49-50
  5.6 本章小结  50-51
6 总结与期望  51-53
致谢  53-54
参考文献  54-58

相似论文

  1. 微细线切割往复走丝机构的设计及控制系统的研究,TG484
  2. 工程陶瓷的激光热裂法切割技术研究,TQ174.62
  3. 虚拟手术中建模与仿真关键技术研究,TP391.41
  4. 开放式精密激光切割数控系统研究,TG485
  5. 题库管理系统中试卷管理模块的设计与实现,TP311.52
  6. 基于空间邻域词袋模型的图像标注技术,TP391.41
  7. 基于混沌映射与FrFT的单通道彩色图像加密算法,TP309.7
  8. 钣金数控切割三维仿真研究,TG48
  9. 单细胞全基因组技术的建立和评价,Q75
  10. 精益造船中零件分道切割及托盘化应用研究,F426.474
  11. 虚拟手术系统中基于混合模型的切割仿真研究,TP391.41
  12. 基于ARM及嵌入式Linux的线切割数控系统原型,TG484
  13. 基于虚拟制造的金属板材成型加工仿真技术研究,TP391.9
  14. 建立LCM分离精子细胞的DNA检测方法及其法医学应用,D919
  15. 玻璃体切割术治疗高度近视性黄斑劈裂及黄斑裂孔的临床疗效观察,R779.6
  16. 丙肝病毒核心基因靶向性M1GS核酶的优化及其活性研究,R512.63
  17. 免疫球蛋白G在成年大鼠肝脏细胞中的表达,R392
  18. 水基线切割液及其组成与效能关系的初步研究,TG484
  19. 电火花线切割加工电极丝损耗机理与实验研究,TG484
  20. 基于静电感应的微细电火花线切割加工技术的研究,TG484

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com