学位论文 > 优秀研究生学位论文题录展示
自然场景中路牌汉字识别技术研究
作 者: 孙彩虹
导 师: 富容国; 张勇东
学 校: 南京理工大学
专 业: 光学工程
关键词: 汉字识别 文本区域提取 文本矫正 文字分割 多级分类
分类号: TP391.43
类 型: 硕士论文
年 份: 2014年
下 载: 28次
引 用: 0次
阅 读: 论文下载
内容摘要
自然场景中存在着大量的交通标志,这些标志信息给人们的日常生活带来诸多方便。研究—种能够自动从路牌图像中提取路牌文字信息的工具对视觉导航、场景理解均有重要意义。本文对从一幅路牌图像中提取路牌汉字信息的关键技术进行了深入研究,主要工作内容如下。首先,本文提出一种“矩形+Harris角点数”的路牌矩形区域定位新方法。该方法先检测出图像中的所有矩形轮廓,再运用Harris角点检测算法对图像进行角点提取,最后将具有最多Harris角点数的矩形轮廓区域确定为路牌矩形区域。经试验验证,在通常情况下,利用该方法对路牌矩形区域定位的准确率很高。其次,本文对路牌区域图像进行预处理,分为对路牌区域图像透视变形矫正和路牌区域字符分割两个部分。对于图像变形矫正部分,首先找出图像平面和世界平面的四组对应点,利用“四点法”对图像进行变形矫正,同时研究了矫正过程所需要的相关插值算法。对于字符分割部分,首先利用二值化算法实现路牌区域文字像素和背景像素的分割,再基于连通域标记法和对标记图进一步的改进处理实现单个汉字图像的分割。通过实验证明,本文方法对于十字型、分栏型等路牌都有很好的分割结果。最后,对于低质量汉字识别,本文构建了先粗分类再细分类的两级识别方法。分类中的分类器均采用正确率较高的KNN分类器。在粗分类中采用粗网格特征和粗外围特征的连合特征构建特征向量。在细分类中首先将汉字图像分成5个分块结构,对每个分块图像运用主成分分析法提取特征,再基于5个分块图像构建5个弱KNN分类器,最后结合5个分类器的分类结果采用投票得分的方法确定最终识别结果。同时对分割出的单个汉字图像特征进行了分析,利用人工方法构造出含有丰富低质量信息的样本,并由此建立数据库。实验验证,本文的两级识别方法对于低质量汉字识别取得较高的识别率。
|
全文目录
摘要 3-4 Abstract 4-6 目录 6-8 1 绪论 8-13 1.1 研究背景和意义 8 1.2 文本识别技术研究现状 8-12 1.2.1 文字区域定位技术 8-10 1.2.2 文字变形矫正技术 10 1.2.3 字符分割技术 10-11 1.2.4 字符识别技术 11-12 1.3 本文研究的主要内容及结构安排 12-13 2 路牌汉字识别的基础理论 13-18 2.1 路牌种类及其文字特征 13-14 2.2 路牌汉字识别系统的基本流程 14-15 2.3 路牌汉字识别系统的数据库构建 15-18 3 路牌矩形区域检测 18-31 3.1 路牌图像矩形轮廓提取算法 18-23 3.1.1 基于RGB模型的彩色图像分解 18-20 3.1.2 三通道灰度图多阈值二值化 20-21 3.1.3 轮廓提取及矩形轮廓判定条件设计 21-23 3.2 路牌图像Harris角点检测算法 23-28 3.2.1 汉字的特征 23 3.2.2 Moravec角点检测算法 23-24 3.2.3 Harris角点检测算法 24-28 3.3 结合矩形与角点数的路牌矩形区域定位 28-31 4 路牌区域图像预处理 31-52 4.1 路牌区域图像透视变形矫正算法 31-40 4.1.1 摄像机光学成像透视分析 32-33 4.1.2 基于四点法的图像透视变形矫正 33-36 4.1.3 插值算法 36-40 4.2 路牌区域字符分割 40-50 4.2.1 灰度化 41-42 4.2.2 二值化 42-46 4.2.3 基于连通域的二值图标记算法 46-48 4.2.4 基于标记图后处理的字符分割 48-50 4.3 汉字大小归一化 50-52 5 基于两级分类方法的路牌汉字识别 52-66 5.1 粗分类的目的和要求 52 5.2 特征提取及汉字的分块构建 52-56 5.2.1 基于连合特征构建全局结构特征 53-54 5.2.2 汉字的五个分块构建方法 54-55 5.2.3 基于PCA的分块图像特征提取 55-56 5.3 分类器的设计 56-59 5.3.1 KNN算法原理 56-57 5.3.2 一级粗分类方案 57 5.3.3 二级细分类方案 57-59 5.4 汉字识别实验结果及分析 59-61 5.5 路牌汉字信息提取实现 61-66 6 总结与展望 66-68 6.1 本文工作总结 66 6.2 下一步工作展望 66-68 致谢 68-69 参考文献 69-71
|
相似论文
- 基于大字符集脱机手写体汉字识别方法研究,TP391.41
- 图片检索在网络敏感信息实时预警系统中的应用,TP391.41
- 基于稀疏表示的脱机手写体汉字识别研究,TP391.1
- 复杂背景图像中的文字提取技术研究,TP391.41
- 基于动态粗外围方向线素特征的脱机手写汉字识别,TP391.43
- 手写体汉字识别方法研究,TP391.43
- 包装箱表面印刷体汉字识别算法研究,TP391.41
- 基于结构分析的离线手写汉字切分,TP391.43
- 方言经验对于儿童早期语素意识与词汇阅读的影响,H193.1
- 泰国学生汉语发音质量与语音意识和汉字识别的关系,H195
- 汉字识别对Multiple Read-Out模型的检验,B842.5
- 基于支持向量机的联机手写汉字识别的研究,TP391.43
- 印刷体汉字识别系统研究与实现,TP391.41
- 基于细化处理的脱机手写汉字识别研究,TP391.43
- 联机手写汉字识别中字根提取算法研究,TP391.43
- 联机手写汉字特征合并与相似字区分算法研究,TP301.6
- 基于支持向量机的车牌汉字识别方法的研究,TP391.41
- 印刷体汉字识别预处理的研究,TP391.43
- 脱机手写体汉字识别系统,TP391.41
- 基于神经网络分类器的汉字识别系统研究,TP391.4
- 基于模糊变换的数学形态学方法及其在图像处理中的应用,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com
|