学位论文 > 优秀研究生学位论文题录展示

篇章级手写识别的用户自适应模型

作 者: 郑晓晓
导 师: 陈清财
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 手写识别 用户自适应 自相似计算 语言模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 12次
引 用: 0次
阅 读: 论文下载
 

内容摘要


传统的手写输入法识别过程包括用户输入,单字识别,用户选择以及改错,在这个过程中,不免会打断用户书写过程中的思路,难以保持书写的连贯性,导致输入法的效率低。同时这种输入法识别模式,导致选择识别候选时,无法使用到文字之间的上下文信息,进一步导致识别率低。在手写识别过程中,每个用户的手写习惯以及连笔情况均不相同,对于独立于特定用户手写习惯的手写识别,相对于特定用户来说,手写识别结果不是很好。针对以上手写输入法存在的问题,本文设计了一种基于篇章文档的用户自适应模型手写识别方法。这种方法可以将手写文字与识别文字共同呈现给用户,可供用户编辑手写文字以及修改识别结果。一方面可以使用文字间上下文关系,进一步提高识别效率,另一方面也可以满足用户书写的流畅度。而针对特定用户来说,采集用户特有的手写特征,使用增量学习的方法,创建以及更新用户模型,以自适应的提高用户识别结果的准确率。利用以上篇章文字之间的上下文信息,使用语言模型以及相似度对识别结果进行后处理,第一候选的识别率有所提高。本文的研究内容以及主要工作包括三个方面。首先,添加自相似计算方法,根据用户手写文档,统计每个手写字符与其相似的手写字符,使用改进的动态时间弯曲算法用来计算两两手写字的相似度,以实现篇章级用户手写文档的相似度分析。其次,根据上下文信息,添加语言模型,使用基于字的二元文法调整候选项的位置。本文中使用N-gram语言模型来实现此功能。最后,构建用户自适应模型,采用增量学习方法,学习用户的手写字符信息,更新用户模型,在更新用户模型过程中,本文使用增量学习的LinearDiscriminated Analysis(LDA)与增量学习的Modified Quadratic DiscriminatedFunction(MQDF)相结合的方法。根据以上对系统做出的改进,识别效果有所提高。通过计算手写字符相似性,有效的减少了用户的修改操作,在修改第一识别结果时,根据字间相似度,能自适应的调整与其相似的手写字符的识别结果,间接地提高了手写识别的准确率。添加基于字的二元文法,并结合单字识别器分类结果,调整第一候选结果。通过实验验证,添加语言模型以及自适应模型后的系统,识别结果有了明显提高。

全文目录


摘要  4-5
Abstract  5-7
目录  7-9
第1章 绪论  9-16
  1.1 课题来源  9-10
  1.2 研究目的及意义  10-11
  1.3 国内外相关技术发展现状  11-15
    1.3.1 脱机识别与联机识别  11-12
    1.3.2 联机手写识别的发展  12-13
    1.3.3 语句级识别后处理技术的发展  13-14
    1.3.4 用户自适应模型的发展  14-15
  1.4 主要研究内容  15-16
第2章 手写汉字识别相关技术研究  16-24
  2.1 引言  16
  2.2 手写字符单字识别方法  16-18
    2.2.1 字符切分  16
    2.2.2 预处理阶段  16-17
    2.2.3 特征提取阶段  17-18
    2.2.4 分类识别阶段  18
  2.3 手写汉字识别后处理技术研究  18-21
    2.3.1 N-gram 语言模型介绍  18-19
    2.3.2 自相似计算方法的研究  19-21
  2.4 用户自适应模型增量学习方法的研究  21-22
  2.5 本章小结  22-24
第3章 篇章级手写识别后处理技术与自适应模型  24-37
  3.1 引言  24
  3.2 篇章级自相似计算方法的改进  24-28
    3.2.1 手写字符预处理技术  24-27
    3.2.2 相似度计算模型  27-28
  3.3 用户自适应模型方法的改进  28-32
    3.3.1 线性判别分析 LDA 算法简介  29-30
    3.3.2 ILDA 算法与 IMQDF 算法的结合  30-31
    3.3.3 添加自适应模型后的识别过程  31-32
  3.4 引入基于字的 N-gram 语言模型  32-36
    3.4.1 处理训练文本  33-34
    3.4.2 N-gram 语言模型结合 MQDF 单字识别器  34-36
  3.5 本章小结  36-37
第4章 系统实现和算法评测  37-51
  4.1 引言  37
  4.2 系统实现  37-41
    4.2.1 iPhone 版手写文档编辑系统简介  37-38
    4.2.2 篇章级手写识别系统  38-41
  4.3 算法评测  41-50
    4.3.1 手写字库介绍  41-42
    4.3.2 自相似计算对比试验  42-44
    4.3.3 添加语言模型后第一候选准确率对比试验  44-47
    4.3.4 添加自适应与单字识别率对比试验  47-50
  4.4 本章小结  50-51
结论  51-52
参考文献  52-58
致谢  58

相似论文

  1. 统计机器翻译中结构转换技术的研究,TP391.2
  2. 词义消歧语料库自动获取方法研究,TP391.1
  3. 基于动态自适应语言模型的手机中文输入系统的研究与实现,TP391.14
  4. 空间手写识别特征提取研究,TP391.41
  5. 基于SVM的联机手写分类器设计,TP391.41
  6. 基于信息依存语言模型的英汉被动结构对比研究,H314.3
  7. 基于词典和概率统计的中文分词算法研究,TP391.1
  8. 基于信息几何的高阶纯相关模型及其应用,TP391.1
  9. UML在空调嵌入式系统开发中的应用研究,TP368.12
  10. 基于模型驱动的动态Web服务组合方法,TP393.09
  11. 基于训练机制的联机维吾尔手写字母识别技术研究,TP391.43
  12. 维吾尔语的N-gram语言模型及其平滑算法研究,TP391.1
  13. 移动平台下手写编辑系统研究与实现,TP311.52
  14. 汉字手写笔迹的实时墨水仿真算法研究,TP391.9
  15. 基于互信息的统计语言模型数据平滑算法,TP391.1
  16. 基于工作流的Web服务组合建模研究,TP393.09
  17. 基于嵌入式的聋哑人无障碍交互技术研究,TP368.12
  18. 搜索语句的时间属性研究及其在检索排序中的应用,TP391.3
  19. 规则与统计相结合的蒙古文编码转换的研究与实现,TP391.1
  20. 基于trigger对的长距离蒙古语语言模型的研究,TP391.42
  21. 限定领域内智能问答系统的研究与实现,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com