学位论文 > 优秀研究生学位论文题录展示
基于连通域特征的手写维吾尔文本行分割
作 者: 易晓芳
导 师: 艾斯卡尔·艾木都拉
学 校: 新疆大学
专 业: 通信与信息系统
关键词: 笔迹文本 行分割 分类处理 分段处理算法 行归附判断
分类号: TP391.43
类 型: 硕士论文
年 份: 2013年
下 载: 18次
引 用: 0次
阅 读: 论文下载
内容摘要
手写体文本行的分割是近年来笔迹文本研究的热点话题,它为文本区域的分割、关键词匹配、字符分割与识别提供了关键信息。准确的对手写文本行进行分割将直接影响到后续的提取识别工作。维吾尔文笔迹文本具有多种主体附属笔画组成方式及书写风格,例如行间倾斜、行间间距小,离散附属笔画多。基于字符连通域的统计与分析是维文笔迹文本处理的基础,因此,本文针对维吾尔文的分割工作展开了以下研究,具体内容如下:1.针对离散附属笔画较多的维吾尔笔迹文本,提出了基于字符连通域的分类处理算法。2.针对主体文本行的相邻文本间字符之间过于紧密的特点,提出了自适应的分段处理算法。3.针对文本行分割线构造过程中出现的问题,采用文本行检测后续处理,对处理过程中出现的文本行分割线融合问题、文本行漏检问题以及行间字符间的粘连字符问题进行了纠正,并对主体文本行定位后的剩余笔画点进行了归附判断。4.设计和开发了基于维吾尔文笔迹特点的文本行分割工具软件,对大量数据进行了测试和评估。
|
全文目录
摘要 3-4 Abstract 4-5 目录 5-7 第一章 绪论 7-12 1.1 论文研究的背景和意义 7-8 1.2 维吾尔文印刷体、手写体分割识别研究现状 8-10 1.3 本文研究内容 10 1.4 本文的组织和结构 10-12 第二章 维吾尔文笔迹图像的获取和预处理 12-25 2.1 引言 12 2.2 维吾尔文特点 12-14 2.2.1 维吾尔文字母的特点 12-13 2.2.2 维吾尔文的手写特点 13-14 2.3 维吾尔文笔迹数据获取 14-18 2.3.1 背景格线的去除 14-15 2.3.2 灰度变换 15-17 2.3.3 二值化 17-18 2.4 预处理 18-24 2.4.1 笔迹图像去噪 19-21 2.4.2 连通域信息统计与分类 21-24 2.5 本章小结 24-25 第三章 文本行分割算法 25-38 3.1 引言 25 3.2 分段涂抹算法 25-28 3.2.1 分段灰度涂抹运算 25-27 3.2.2 二值化运算及填充删除操作 27-28 3.3 膨胀与细化算法 28-29 3.4 文本行检测后续处理 29-34 3.4.1 文本行细化线融合技术 29-31 3.4.2 漏检文本行的更正 31-32 3.4.3 粘连字符的分割 32-34 3.5 着色处理与文本行提取 34-37 3.5.1 主体连通域的着色处理 34-35 3.5.2 第一类连通域笔画及剩余笔画的着色处理 35 3.5.3 文本行分割提取 35-37 3.6 本章小结 37-38 第四章 文本行分割软件开发及实验结果分析 38-47 4.1 文本行分割工具软件总体设计 38-40 4.2 实验结果分析 40-46 4.2.1 基于字符连通域的分类测试 40-42 4.2.2 行检测后续处理对分割率的影响 42 4.2.3 效果评估与分割结果分析 42-46 4.3 本章小结 46-47 第五章 总结与展望 47-49 参考文献 49-51 攻读硕士期间发表论文和参加科研情况 51-52 致谢 52
|
相似论文
- 论我国劳动争议分类处理机制,D922.591
- 文档图像段落分割技术研究与应用,TP391.41
- 英语难句的汉译探讨,H315.9
- 垃圾回收箱造型设计探析,TU993
- 高速公路生态环境的遥感信息提取与评价,X87
- 医疗电子病历帐票子系统的设计和实现,TP311.52
- 阜新市垃圾分类处理系统研究,TU993
- 未成年人犯罪暂缓起诉制度研究,D925.2
- 四川棱子芹属(Pleurospermum Hoffm.)系统学研究,Q941
- 完善我国劳动争议处理程序的法律思考,D922.591
- 中国大戟族(Tribe Euphorbieae)的系统分类与进化研究,Q941
- 家庭—小区相结合的垃圾分类处理模式研究,X799.3
- 面向生产型企业的销售管理信息系统的设计与实现,TP311.52
- 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
- 基于BP神经网络的脱机手写汉字识别研究,TP391.43
- 联机手写维吾尔文单词识别关键技术研究,TP391.43
- 基于机器学习的文字判断和识别算法研究与系统实现,TP391.43
- 基于四角结构特征的脱机手写汉字识别,TP391.43
- 中文手写体文本分割算法的研究,TP391.43
- 基于语篇的中文命名实体识别研究,TP391.43
- 基于HMM的联机手写汉字识别,TP391.43
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com
|