学位论文 > 优秀研究生学位论文题录展示

基于连通域特征的手写维吾尔文本行分割

作 者: 易晓芳
导 师: 艾斯卡尔·艾木都拉
学 校: 新疆大学
专 业: 通信与信息系统
关键词: 笔迹文本 行分割 分类处理 分段处理算法 行归附判断
分类号: TP391.43
类 型: 硕士论文
年 份: 2013年
下 载: 18次
引 用: 0次
阅 读: 论文下载
 

内容摘要


手写体文本行的分割是近年来笔迹文本研究的热点话题,它为文本区域的分割、关键词匹配、字符分割与识别提供了关键信息。准确的对手写文本行进行分割将直接影响到后续的提取识别工作。维吾尔文笔迹文本具有多种主体附属笔画组成方式及书写风格,例如行间倾斜、行间间距小,离散附属笔画多。基于字符连通域的统计与分析是维文笔迹文本处理的基础,因此,本文针对维吾尔文的分割工作展开了以下研究,具体内容如下:1.针对离散附属笔画较多的维吾尔笔迹文本,提出了基于字符连通域的分类处理算法。2.针对主体文本行的相邻文本间字符之间过于紧密的特点,提出了自适应的分段处理算法。3.针对文本行分割线构造过程中出现的问题,采用文本行检测后续处理,对处理过程中出现的文本行分割线融合问题、文本行漏检问题以及行间字符间的粘连字符问题进行了纠正,并对主体文本行定位后的剩余笔画点进行了归附判断。4.设计和开发了基于维吾尔文笔迹特点的文本行分割工具软件,对大量数据进行了测试和评估。

全文目录


摘要  3-4
Abstract  4-5
目录  5-7
第一章 绪论  7-12
  1.1 论文研究的背景和意义  7-8
  1.2 维吾尔文印刷体、手写体分割识别研究现状  8-10
  1.3 本文研究内容  10
  1.4 本文的组织和结构  10-12
第二章 维吾尔文笔迹图像的获取和预处理  12-25
  2.1 引言  12
  2.2 维吾尔文特点  12-14
    2.2.1 维吾尔文字母的特点  12-13
    2.2.2 维吾尔文的手写特点  13-14
  2.3 维吾尔文笔迹数据获取  14-18
    2.3.1 背景格线的去除  14-15
    2.3.2 灰度变换  15-17
    2.3.3 二值化  17-18
  2.4 预处理  18-24
    2.4.1 笔迹图像去噪  19-21
    2.4.2 连通域信息统计与分类  21-24
  2.5 本章小结  24-25
第三章 文本行分割算法  25-38
  3.1 引言  25
  3.2 分段涂抹算法  25-28
    3.2.1 分段灰度涂抹运算  25-27
    3.2.2 二值化运算及填充删除操作  27-28
  3.3 膨胀与细化算法  28-29
  3.4 文本行检测后续处理  29-34
    3.4.1 文本行细化线融合技术  29-31
    3.4.2 漏检文本行的更正  31-32
    3.4.3 粘连字符的分割  32-34
  3.5 着色处理与文本行提取  34-37
    3.5.1 主体连通域的着色处理  34-35
    3.5.2 第一类连通域笔画及剩余笔画的着色处理  35
    3.5.3 文本行分割提取  35-37
  3.6 本章小结  37-38
第四章 文本行分割软件开发及实验结果分析  38-47
  4.1 文本行分割工具软件总体设计  38-40
  4.2 实验结果分析  40-46
    4.2.1 基于字符连通域的分类测试  40-42
    4.2.2 行检测后续处理对分割率的影响  42
    4.2.3 效果评估与分割结果分析  42-46
  4.3 本章小结  46-47
第五章 总结与展望  47-49
参考文献  49-51
攻读硕士期间发表论文和参加科研情况  51-52
致谢  52

相似论文

  1. 论我国劳动争议分类处理机制,D922.591
  2. 文档图像段落分割技术研究与应用,TP391.41
  3. 英语难句的汉译探讨,H315.9
  4. 垃圾回收箱造型设计探析,TU993
  5. 高速公路生态环境的遥感信息提取与评价,X87
  6. 医疗电子病历帐票子系统的设计和实现,TP311.52
  7. 阜新市垃圾分类处理系统研究,TU993
  8. 未成年人犯罪暂缓起诉制度研究,D925.2
  9. 四川棱子芹属(Pleurospermum Hoffm.)系统学研究,Q941
  10. 完善我国劳动争议处理程序的法律思考,D922.591
  11. 中国大戟族(Tribe Euphorbieae)的系统分类与进化研究,Q941
  12. 家庭—小区相结合的垃圾分类处理模式研究,X799.3
  13. 面向生产型企业的销售管理信息系统的设计与实现,TP311.52
  14. 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
  15. 基于BP神经网络的脱机手写汉字识别研究,TP391.43
  16. 联机手写维吾尔文单词识别关键技术研究,TP391.43
  17. 基于机器学习的文字判断和识别算法研究与系统实现,TP391.43
  18. 基于四角结构特征的脱机手写汉字识别,TP391.43
  19. 中文手写体文本分割算法的研究,TP391.43
  20. 基于语篇的中文命名实体识别研究,TP391.43
  21. 基于HMM的联机手写汉字识别,TP391.43

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com