学位论文 > 优秀研究生学位论文题录展示
基于图分割的文本提取方法研究
作 者: 李长明
导 师: 黄剑华
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 字符分割 谱聚类 纹理 图分割
分类号: TP391.41
类 型: 硕士论文
年 份: 2008年
下 载: 117次
引 用: 0次
阅 读: 论文下载
内容摘要
随着数字科技的迅速发展,从图像中提取文本信息的研究越来越受到人们的关注。图像中的文本能够提供有用的信息,是描述图像内容的关键,这些信息可以作为图像资料的自动注释、索引、压缩等方面的重要参考。从图像中提取文本信息需要经过文本区域检测、定位,字符提取,字符识别等步骤,文本字符提取是从图像中自动提取文本信息的重要一步。本文首先改进了一种基于图分割理论的阈值分割方法。将待处理的图像转为灰度值0~255的灰度图像,利用像素点和邻域内像素点的相似关系,构建一个256*256的灰度矩阵M。矩阵M表示了待处理图像的灰度图像内各灰度值的相似度,采用遍历的方式找出其中应用图谱分割评价标准的值最小的灰度值。选用这个灰度值,作为阈值分割点。本文提出了一种基于直方图的谱聚类分割方法。首先将待处理的图像转为灰度值0~255的灰度图像,利用像素点和邻域内像素点的相似关系,构建一个256*256的灰度矩阵M。然后应用图谱分割的算法,对矩阵M进行分类,最后的分类结果将256个灰度值分成了两类,进而实现了对原图像的分割。纹理是文本图像中的重要特征,文本区域往往具有不同于背景的特殊纹理。本文利用字符区域的纹理特征结合直方图的图谱分割方法,构建了一个二次聚类框架实现对复杂背景图像的字符提取。本文还将灰度图像中的字符提取方法推广到彩色图像中,对彩色图像的每一个分量应用基于直方图的图分割方法,运用投票策略,实现了彩色图像中的字符提取。最后,本文提出了一种用来评价字符提取效果的标准,在此标准下,验证了前文中提出的各种方法,实验结果表明,基于直方图的谱聚类字符分割方法优于阈值化分割,对具有复杂背景的字符图像能够有效地分离出字符。
|
全文目录
摘要 3-4 Abstract 4-8 第1章 绪论 8-14 1.1 课题背景 8 1.2 本课题的有关领域现状 8-11 1.2.1 文本提取研究现状 8-10 1.2.2 文本图像的分割现状 10-11 1.3 本课题的主要研究内容 11-14 1.3.1 适合文本图像的阈值分割方法 12 1.3.2 基于直方图的图分割方法 12-13 1.3.3 加入纹理的阈值分割方法 13 1.3.4 针对彩色图像的阈值分割方法 13 1.3.5 本文结构 13-14 第2章 基于灰度直方图的图谱分割字符提取 14-31 2.1 经典的阈值分割方法 14-16 2.1.1 灰度直方图峰谷法 15 2.1.2 最小误差法 15 2.1.3 最大类间方差法(otsu法) 15-16 2.1.4 最大熵自动阈值法 16 2.2 基于图谱分割的阈值分割 16-20 2.2.1 现有的基于图谱分割的阈值分割算法 16-17 2.2.2 适合文本图像的基于图谱分割的阈值分割算法 17-20 2.3 基于灰度直方图的图谱分割字符提取 20-30 2.3.1 常规阈值分割方法的不足 20-21 2.3.2 图谱分割理论 21-23 2.3.3 基于直方图的图分割方法 23-30 2.4 本章小结 30-31 第3章 二次聚类框架下的字符提取 31-44 3.1 基于谱分割的二次聚类框架 31-35 3.2 基于纹理特征的谱分割 35-40 3.2.1 利用共生矩阵提取纹理特征 35-37 3.2.2 利用Gabor滤波器提取纹理特征 37-40 3.3 彩色文本图像中的字符分割 40-43 3.3.1 直接灰度化的缺陷 40-42 3.3.2 基于投票法的彩色文本图像的文本字符提取 42-43 3.4 本章小结 43-44 第4章 性能评价 44-51 4.1 字符分割评价标准 45-48 4.2 实验结果对比 48-50 4.3 本章小结 50-51 结论 51-52 参考文献 52-57 致谢 57
|
相似论文
- 基于纹理特征的视频编码技术研究,TP391.41
- 基于空间—频率域的织物组织识别新技术研究,TS101.923
- 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
- ASAR与MODIS协同的海洋溢油信息提取,X87
- 高分辨率SAR影像裸土信息提取及土壤含水量反演初探,S152.7
- 基于样图的纹理合成算法研究,TP391.41
- 基于粒子系统的火焰和烟花实时模拟技术研究,TP391.9
- 基于PowerPC架构的车牌识别算法研究,TP391.41
- 基于车牌识别技术的智能交通系统的设计与实现,TP391.41
- 一类工具加工痕迹的检验识别,TP391.41
- 基于SVM的车牌字符识别算法研究与实现,TP391.41
- 一个球幕投影系统的设计与实现,TP391.41
- 基于GPU的Shader实时折射和焦散效果的研究,TP391.41
- 大规模三维场景实时呈现方法的研究,TP391.41
- 印刷体数学公式识别的研究与实现,TP391.41
- 乳腺肿块纹理特征提取及辅助诊断方法研究,TP391.41
- 基于谱聚类的无监督图像分割,TP391.41
- 地震图数字化中波形校正与跟踪方法的研究,TP391.41
- 掌纹图像特征抽取方法研究,TP391.41
- 交互式局部约束织物纹理映射技术的研究与实现,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|