学位论文 > 优秀研究生学位论文题录展示
手写体汉字结构的全局统计建模与识别方法研究
作 者: 杨栋
导 师: 刘峡壁
学 校: 北京理工大学
专 业: 计算机科学与技术
关键词: 手写体汉字识别 特征点匹配 统计建模 结构方法 判别学习
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 70次
引 用: 0次
阅 读: 论文下载
内容摘要
手写体汉字识别是模式识别和人工智能领域中的重要研究内容,在人机自然交互和文字信息自动处理等领域有着广泛的应用。目前,在完全自由书写的手写体汉字识别上还存在困难。统计-结构方法是解决这一难题的新途径。本文研究手写体汉字识别的统计-结构方法,主要研究内容包括笔画特征点的匹配与提取以及汉字结构的统计建模与识别。提出了一种基于动态规划和交替优化的笔画特征点匹配方法,用于在汉字结构模型引导下,从输入汉字中提取笔画特征点。首先,用笔画上点集间的相似性度量笔画相似性,在此基础上利用改进最小风险算法和连笔自由的笔画排序算法实现笔画匹配,以适应笔顺自由与连笔情况。然后,基于动态规划方法,计算输入笔画与对应模型笔画上特征点之间的匹配关系。根据笔画特征点的匹配关系,估计输入汉字与汉字模型之间的仿射变换,对输入汉字进行相应变换。最后,通过特征点匹配与仿射变换的交替迭代来优化匹配效果。在CASIA-OLHWDB1联机手写体汉字数据库上进行了笔画特征点匹配实验。实验结果表明所提出的特征点提取方法是有效的。提出了一种汉字结构的全局统计建模与识别方法。将笔画特征点按模型笔顺排列起来,形成汉字结构的全局表示。确定输入汉字与汉字模型笔画特征点之间的匹配关系以后,计算对应特征点在位置和笔画曲率上的差异。假设同类汉字的样本差异服从高斯混合分布,利用期望最大化算法和最大-最小后验伪概率算法在训练数据集上学习得到该高斯混合分布。识别时,计算输入汉字在汉字结构统计模型下的后验伪概率以及输入汉字与汉字模型结构复杂度的差异,综合二者,获得输入汉字与汉字模型的相似度,作为分类依据。在CASIA-OLHWDB1联机手写体汉字数据库上进行了形近字的识别实验。实验结果显示所提出的识别方法是可行的。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-18 1.1 概述 9-10 1.2 手写体汉字识别方法研究现状 10-13 1.2.1 统计方法 10-11 1.2.2 结构方法 11-12 1.2.3 统计-结构方法 12-13 1.2.4 集成方法 13 1.3 常用数据库及其识别结果 13-15 1.4 本文的研究目标与内容 15-16 1.5 论文结构 16-18 第2章 基于动态规划的笔画特征点提取方法 18-36 2.1 引言 18-21 2.2 笔画匹配方法 21-28 2.2.1 数学描述 22 2.2.2 改进的最小风险算法 22-23 2.2.3 笔画匹配度的计算 23-25 2.2.4 连笔自由的笔画排序方法 25-28 2.3 特征点匹配方法 28-31 2.4 实验 31-35 2.4.1 参数设置 31-32 2.4.2 实验结果 32-35 2.5 小结 35-36 第3章 特征点匹配与仿射变换的交替优化 36-45 3.1 引言 36 3.2 仿射变换 36-38 3.2.1 仿射变换介绍 36-37 3.2.2 仿射变换的参数估计 37-38 3.3 交替优化 38-40 3.4 实验 40-44 3.5 小结 44-45 第4章 汉字结构的全局统计建模与识别 45-58 4.1 引言 45-46 4.2 汉字结构的全局统计建模 46-48 4.2.1 汉字结构的全局表示 46-47 4.2.2 高斯混合建模 47-48 4.3 后验伪概率分类器 48-49 4.4 后验伪概率分类器的学习 49-53 4.4.1 EM算法 50-51 4.4.2 MMP算法 51-53 4.5 识别方法 53-54 4.5.1 二分类识别 53-54 4.5.2 多分类识别 54 4.6 实验 54-57 4.6.1 参数设置 55-56 4.6.2 实验结果 56-57 4.7 小结 57-58 第5章 结论与展望 58-60 5.1 全文总结 58-59 5.2 进一步的工作 59-60 参考文献 60-65 攻读学位期间发表论文与研究成果清单 65-66 致谢 66
|
相似论文
- 机器人自动巡检系统中图像配准与图像匹配问题的研究,TP242.62
- 图像与视频序列的颜色校正研究,TP391.41
- 基于特征的图像匹配算法研究,TP391.41
- 基于MRF模型和统计建模的SAR图像地物分类方法研究,TN957.52
- 基于平行双目视觉的环境特征提取方法研究,TP391.41
- 基于无人直升机航拍照片的三维目标重建技术,TP391.41
- 字符图像的定位与特征点匹配技术研究,TP391.41
- 极化SAR图像目标检测方法研究,TN957.52
- 石化过程生产指标的在线估计方法研究,TE624
- 基于双目立体视觉的特征点匹配关键技术研究与应用,TP391.41
- 图像统计建模及其在图像取证中的应用研究,TP391.41
- 手写体汉字识别方法研究,TP391.43
- CCD双目视觉三维测量,TP391.41
- 基于特征点光流估计的运动目标跟踪算法理论及分析,TP391.41
- 基于特征点的图像自动拼接算法研究,TP391.41
- 太阳过渡区精细结构的紫外观测资料的初步分析,P182
- 基于逻辑回归模型的垃圾邮件过滤系统的研究,TP393.098
- 大型工件特征点三维测量系统研究,TP391.41
- 基于笔段特征与方向特征的联机手写汉字识别研究,TP391.41
- 基于特征融合的脱机手写体汉字识别,TP391.43
- SAR图像舰船目标检测方法研究,TN957.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|