学位论文 > 优秀研究生学位论文题录展示

基于图分割的文本提取方法研究

作 者: 李长明
导 师: 黄剑华
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 字符分割 谱聚类 纹理 图分割
分类号: TP391.41
类 型: 硕士论文
年 份: 2008年
下 载: 117次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着数字科技的迅速发展,从图像中提取文本信息的研究越来越受到人们的关注。图像中的文本能够提供有用的信息,是描述图像内容的关键,这些信息可以作为图像资料的自动注释、索引、压缩等方面的重要参考。从图像中提取文本信息需要经过文本区域检测、定位,字符提取,字符识别等步骤,文本字符提取是从图像中自动提取文本信息的重要一步。本文首先改进了一种基于图分割理论的阈值分割方法。将待处理的图像转为灰度值0~255的灰度图像,利用像素点和邻域内像素点的相似关系,构建一个256*256的灰度矩阵M。矩阵M表示了待处理图像的灰度图像内各灰度值的相似度,采用遍历的方式找出其中应用图谱分割评价标准的值最小的灰度值。选用这个灰度值,作为阈值分割点。本文提出了一种基于直方图的谱聚类分割方法。首先将待处理的图像转为灰度值0~255的灰度图像,利用像素点和邻域内像素点的相似关系,构建一个256*256的灰度矩阵M。然后应用图谱分割的算法,对矩阵M进行分类,最后的分类结果将256个灰度值分成了两类,进而实现了对原图像的分割。纹理是文本图像中的重要特征,文本区域往往具有不同于背景的特殊纹理。本文利用字符区域的纹理特征结合直方图的图谱分割方法,构建了一个二次聚类框架实现对复杂背景图像的字符提取。本文还将灰度图像中的字符提取方法推广到彩色图像中,对彩色图像的每一个分量应用基于直方图的图分割方法,运用投票策略,实现了彩色图像中的字符提取。最后,本文提出了一种用来评价字符提取效果的标准,在此标准下,验证了前文中提出的各种方法,实验结果表明,基于直方图的谱聚类字符分割方法优于阈值化分割,对具有复杂背景的字符图像能够有效地分离出字符。

全文目录


摘要  3-4
Abstract  4-8
第1章 绪论  8-14
  1.1 课题背景  8
  1.2 本课题的有关领域现状  8-11
    1.2.1 文本提取研究现状  8-10
    1.2.2 文本图像的分割现状  10-11
  1.3 本课题的主要研究内容  11-14
    1.3.1 适合文本图像的阈值分割方法  12
    1.3.2 基于直方图的图分割方法  12-13
    1.3.3 加入纹理的阈值分割方法  13
    1.3.4 针对彩色图像的阈值分割方法  13
    1.3.5 本文结构  13-14
第2章 基于灰度直方图的图谱分割字符提取  14-31
  2.1 经典的阈值分割方法  14-16
    2.1.1 灰度直方图峰谷法  15
    2.1.2 最小误差法  15
    2.1.3 最大类间方差法(otsu法)  15-16
    2.1.4 最大熵自动阈值法  16
  2.2 基于图谱分割的阈值分割  16-20
    2.2.1 现有的基于图谱分割的阈值分割算法  16-17
    2.2.2 适合文本图像的基于图谱分割的阈值分割算法  17-20
  2.3 基于灰度直方图的图谱分割字符提取  20-30
    2.3.1 常规阈值分割方法的不足  20-21
    2.3.2 图谱分割理论  21-23
    2.3.3 基于直方图的图分割方法  23-30
  2.4 本章小结  30-31
第3章 二次聚类框架下的字符提取  31-44
  3.1 基于谱分割的二次聚类框架  31-35
  3.2 基于纹理特征的谱分割  35-40
    3.2.1 利用共生矩阵提取纹理特征  35-37
    3.2.2 利用Gabor滤波器提取纹理特征  37-40
  3.3 彩色文本图像中的字符分割  40-43
    3.3.1 直接灰度化的缺陷  40-42
    3.3.2 基于投票法的彩色文本图像的文本字符提取  42-43
  3.4 本章小结  43-44
第4章 性能评价  44-51
  4.1 字符分割评价标准  45-48
  4.2 实验结果对比  48-50
  4.3 本章小结  50-51
结论  51-52
参考文献  52-57
致谢  57

相似论文

  1. 基于纹理特征的视频编码技术研究,TP391.41
  2. 基于空间—频率域的织物组织识别新技术研究,TS101.923
  3. 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
  4. ASAR与MODIS协同的海洋溢油信息提取,X87
  5. 高分辨率SAR影像裸土信息提取及土壤含水量反演初探,S152.7
  6. 基于样图的纹理合成算法研究,TP391.41
  7. 基于粒子系统的火焰和烟花实时模拟技术研究,TP391.9
  8. 基于PowerPC架构的车牌识别算法研究,TP391.41
  9. 基于车牌识别技术的智能交通系统的设计与实现,TP391.41
  10. 一类工具加工痕迹的检验识别,TP391.41
  11. 基于SVM的车牌字符识别算法研究与实现,TP391.41
  12. 一个球幕投影系统的设计与实现,TP391.41
  13. 基于GPU的Shader实时折射和焦散效果的研究,TP391.41
  14. 大规模三维场景实时呈现方法的研究,TP391.41
  15. 印刷体数学公式识别的研究与实现,TP391.41
  16. 乳腺肿块纹理特征提取及辅助诊断方法研究,TP391.41
  17. 基于谱聚类的无监督图像分割,TP391.41
  18. 地震图数字化中波形校正与跟踪方法的研究,TP391.41
  19. 掌纹图像特征抽取方法研究,TP391.41
  20. 交互式局部约束织物纹理映射技术的研究与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com