学位论文 > 优秀研究生学位论文题录展示
篇章级手写识别的用户自适应模型
作 者: 郑晓晓
导 师: 陈清财
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 手写识别 用户自适应 自相似计算 语言模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 12次
引 用: 0次
阅 读: 论文下载
内容摘要
传统的手写输入法识别过程包括用户输入,单字识别,用户选择以及改错,在这个过程中,不免会打断用户书写过程中的思路,难以保持书写的连贯性,导致输入法的效率低。同时这种输入法识别模式,导致选择识别候选时,无法使用到文字之间的上下文信息,进一步导致识别率低。在手写识别过程中,每个用户的手写习惯以及连笔情况均不相同,对于独立于特定用户手写习惯的手写识别,相对于特定用户来说,手写识别结果不是很好。针对以上手写输入法存在的问题,本文设计了一种基于篇章文档的用户自适应模型手写识别方法。这种方法可以将手写文字与识别文字共同呈现给用户,可供用户编辑手写文字以及修改识别结果。一方面可以使用文字间上下文关系,进一步提高识别效率,另一方面也可以满足用户书写的流畅度。而针对特定用户来说,采集用户特有的手写特征,使用增量学习的方法,创建以及更新用户模型,以自适应的提高用户识别结果的准确率。利用以上篇章文字之间的上下文信息,使用语言模型以及相似度对识别结果进行后处理,第一候选的识别率有所提高。本文的研究内容以及主要工作包括三个方面。首先,添加自相似计算方法,根据用户手写文档,统计每个手写字符与其相似的手写字符,使用改进的动态时间弯曲算法用来计算两两手写字的相似度,以实现篇章级用户手写文档的相似度分析。其次,根据上下文信息,添加语言模型,使用基于字的二元文法调整候选项的位置。本文中使用N-gram语言模型来实现此功能。最后,构建用户自适应模型,采用增量学习方法,学习用户的手写字符信息,更新用户模型,在更新用户模型过程中,本文使用增量学习的LinearDiscriminated Analysis(LDA)与增量学习的Modified Quadratic DiscriminatedFunction(MQDF)相结合的方法。根据以上对系统做出的改进,识别效果有所提高。通过计算手写字符相似性,有效的减少了用户的修改操作,在修改第一识别结果时,根据字间相似度,能自适应的调整与其相似的手写字符的识别结果,间接地提高了手写识别的准确率。添加基于字的二元文法,并结合单字识别器分类结果,调整第一候选结果。通过实验验证,添加语言模型以及自适应模型后的系统,识别结果有了明显提高。
|
全文目录
摘要 4-5 Abstract 5-7 目录 7-9 第1章 绪论 9-16 1.1 课题来源 9-10 1.2 研究目的及意义 10-11 1.3 国内外相关技术发展现状 11-15 1.3.1 脱机识别与联机识别 11-12 1.3.2 联机手写识别的发展 12-13 1.3.3 语句级识别后处理技术的发展 13-14 1.3.4 用户自适应模型的发展 14-15 1.4 主要研究内容 15-16 第2章 手写汉字识别相关技术研究 16-24 2.1 引言 16 2.2 手写字符单字识别方法 16-18 2.2.1 字符切分 16 2.2.2 预处理阶段 16-17 2.2.3 特征提取阶段 17-18 2.2.4 分类识别阶段 18 2.3 手写汉字识别后处理技术研究 18-21 2.3.1 N-gram 语言模型介绍 18-19 2.3.2 自相似计算方法的研究 19-21 2.4 用户自适应模型增量学习方法的研究 21-22 2.5 本章小结 22-24 第3章 篇章级手写识别后处理技术与自适应模型 24-37 3.1 引言 24 3.2 篇章级自相似计算方法的改进 24-28 3.2.1 手写字符预处理技术 24-27 3.2.2 相似度计算模型 27-28 3.3 用户自适应模型方法的改进 28-32 3.3.1 线性判别分析 LDA 算法简介 29-30 3.3.2 ILDA 算法与 IMQDF 算法的结合 30-31 3.3.3 添加自适应模型后的识别过程 31-32 3.4 引入基于字的 N-gram 语言模型 32-36 3.4.1 处理训练文本 33-34 3.4.2 N-gram 语言模型结合 MQDF 单字识别器 34-36 3.5 本章小结 36-37 第4章 系统实现和算法评测 37-51 4.1 引言 37 4.2 系统实现 37-41 4.2.1 iPhone 版手写文档编辑系统简介 37-38 4.2.2 篇章级手写识别系统 38-41 4.3 算法评测 41-50 4.3.1 手写字库介绍 41-42 4.3.2 自相似计算对比试验 42-44 4.3.3 添加语言模型后第一候选准确率对比试验 44-47 4.3.4 添加自适应与单字识别率对比试验 47-50 4.4 本章小结 50-51 结论 51-52 参考文献 52-58 致谢 58
|
相似论文
- 统计机器翻译中结构转换技术的研究,TP391.2
- 词义消歧语料库自动获取方法研究,TP391.1
- 基于动态自适应语言模型的手机中文输入系统的研究与实现,TP391.14
- 空间手写识别特征提取研究,TP391.41
- 基于SVM的联机手写分类器设计,TP391.41
- 基于信息依存语言模型的英汉被动结构对比研究,H314.3
- 基于词典和概率统计的中文分词算法研究,TP391.1
- 基于信息几何的高阶纯相关模型及其应用,TP391.1
- UML在空调嵌入式系统开发中的应用研究,TP368.12
- 基于模型驱动的动态Web服务组合方法,TP393.09
- 基于训练机制的联机维吾尔手写字母识别技术研究,TP391.43
- 维吾尔语的N-gram语言模型及其平滑算法研究,TP391.1
- 移动平台下手写编辑系统研究与实现,TP311.52
- 汉字手写笔迹的实时墨水仿真算法研究,TP391.9
- 基于互信息的统计语言模型数据平滑算法,TP391.1
- 基于工作流的Web服务组合建模研究,TP393.09
- 基于嵌入式的聋哑人无障碍交互技术研究,TP368.12
- 搜索语句的时间属性研究及其在检索排序中的应用,TP391.3
- 规则与统计相结合的蒙古文编码转换的研究与实现,TP391.1
- 基于trigger对的长距离蒙古语语言模型的研究,TP391.42
- 限定领域内智能问答系统的研究与实现,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|