学位论文 > 优秀研究生学位论文题录展示

脱机手写阿拉伯文切分算法及多队列基元合并模型

作 者: 修平平
导 师: 丁晓青
学 校: 清华大学
专 业: 信号与信息处理
关键词: 光学字符识别 文字切分 阿拉伯文 动态规划
分类号: TP391.1
类 型: 硕士论文
年 份: 2006年
下 载: 135次
引 用: 1次
阅 读: 论文下载
 

内容摘要


光学字符识别技术(OCR)已经有几十年的发展历史,它能够把纸质文档中的文字图像自动转化为内码,节约了大量的人力、时间和金钱,加快了信息数字化的进程。近年来,由于阿拉伯文档数字化的需求大量增加,阿拉伯文文字图像的脱机手写识别的研究在业界和学术界获得了越来越多的关注。阿拉伯文OCR的主要难点在“字符切分”上。作为一种字符连写的文字,阿拉伯文在切分算法的设计上和拉丁文与中文有较大不同。本文针对阿拉伯文特点设计并实现了脱机手写阿拉伯文OCR系统中的字符切分关键技术,提出了一种先进行“过切分”,再进行“基元合并”的切分策略。“过切分”是将连写字符的图像切割成字符或字符部件的步骤。我们把这些字符或字符部件称之为基元。本文针对阿拉伯文字在基线上连接的特性,采用基于轮廓特征的几何过切分,通过三种不同的轮廓特征点来得到候选的切分点。“基元合并”是将基元合并成完整字符的步骤。在本文中,提出了一个“多队列基元合并模型”来描述阿拉伯文基元的复杂二维布局情况,并给出解决办法。首先,根据基元的水平位置分成三个队列,构建三维的切分状态空间。由于在此空间中,状态路径描述了基元的候选合并方案,因此,基元合并问题转化为状态路径的寻优问题。字符的置信度由多种鉴别信息(即对决策有用的信息)综合计算。对切分路径的最优化采用动态规划算法。通过实验证实,本文系统的实测性能大幅提升。在多种书写风格的样张上,本系统的性能平均提高了17.9个百分点。在阿拉伯文切分的实际工作基础上,本文提出基元合并的多队列模型理论。阿拉伯文的基元排列特点与其它文字切分的应用存在内在的联系。对于任何二维的复杂基元排列,其基元间位置约束的信息都可由“位置关系图”来描述。通过位置关系图可以生成多队列模型,进而可利用状态路径对复杂的合并方案进行描述。在此理论观点下,一些预处理步骤其实也可以纳入到切分和识别的框架中。本文对多队列基元合并模型的理论分析是对阿拉伯文脱机手写实践的思想总结,有助于解决复杂基元排列下的字符切分问题。

全文目录


摘要  3-4
Abstract  4-7
第1章 引言  7-15
  1.1 课题背景  7-8
  1.2 阿拉伯文字的特点  8-10
  1.3 阿拉伯文切分方法概述  10-12
  1.4 本文研究概述  12-13
  1.5 本文的主要贡献  13-14
  1.6 各章内容简介  14-15
第2章 过切分技术  15-21
  2.1 手写阿拉伯文字过切分技术的难点  15
  2.2 常见方法分析  15-19
  2.3 基于轮廓特征过切分的算法实现  19-20
  2.4 本章小结  20-21
第3章 多队列基元合并模型  21-35
  3.1 阿拉伯文字基元合并的难点  21-27
  3.2 文献调研  27-28
  3.3 多队列基元合并模型的建模  28-31
  3.4 动态规划求解最佳路径  31-33
  3.5 本章小结  33-35
第4章 系统和实验分析  35-45
  4.1 系统总体流程  35
  4.2 实验结果及分析  35-44
  4.3 本章小结  44-45
第5章 多队列基元合并模型理论建模  45-57
  5.1 本章引论  45-48
  5.2 多队列模型  48-54
  5.3 应用一:阿拉伯文基元的队列结构  54
  5.4 应用二:含标注符号的古籍汉字基元的队列结构  54-56
  5.5 本章小结  56-57
第6章 结论  57-59
  6.1 研究总结  57-58
  6.2 需进一步开展的工作  58-59
参考文献  59-64
致谢  64-65
个人简历、在学期间发表的学术论文与研究成果  65

相似论文

  1. 基于参考图像的乳腺肿块诊断方法研究,TP391.41
  2. 电力系统电压无功控制方法研究,TM761.1
  3. 主观题自动评分技术研究,TP391.1
  4. 水库多目标优化调度研究,TV697.1
  5. 基于动态规划的房地产多项目开发优化决策,F293.3
  6. 音乐信号节奏信息实时获取技术研究与系统实现,TN912.3
  7. 软件企业人力资源调度方法研究与实现,TP311.52
  8. 面向DAG数据依赖型应用系统研究与实现,TP311.1
  9. 不相容工件族的平行批序的一些结果,O223
  10. 输电线路建设项目成本管理研究,F426.61
  11. 客运专线综合维修计划编制系统的研究,U29-39
  12. 虚拟企业的收益分配研究,F270.7
  13. 基于支撑笔画的视觉文档图像透视失真校正,TP391.41
  14. 数学表达式结构分析的后处理研究,TP391.4
  15. 缴费确定型企业年金最优投资战略研究,F842.6;F272
  16. 基于动态规划的应急资源运输调度研究,O221.3
  17. 模具标准零配件及周边产品之存货模式研究,F426.6;F273.4
  18. 3M公司汽车相关新产品扩散模型及库存优化,F426.471
  19. 基于动态规划方法的地下采矿边界品位优化研究,TD862.1
  20. 基于食物链生态进化算法的输电网扩展规划,TM715
  21. 电力市场下节能发电机组组合的研究,TM31

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com