学位论文 > 优秀研究生学位论文题录展示

基于条件随机场的目标提取

作 者: 张晓峰
导 师: 吕岳
学 校: 华东师范大学
专 业: 计算机应用技术
关键词: 目标提取 条件随机场 马尔可夫随机场 文字提取 轮廓片段 开关映射 Gabor滤波 边缘共生矩阵
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 661次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目标提取是将感兴趣的目标从背景中分离出来的过程,是计算机视觉的重要组成部分,是图像理解与识别的关键步骤。由于目标本身的复杂性和背景的多变性等因素,准确地提取目标是一项充满挑战性的任务。组成目标的各个部分之间有密切的联系,使用当前位置和周围区域的联系能够有效减少图像的不确定性和模糊性给目标提取带来的负面影响,因此如何利用上下文信息成为目标提取的研究热点。条件随机场(Conditional Random Field, CRF)是在马尔可夫随机场(Markov Random Field, MRF)的基础上发展起来的,它不仅可以利用相邻节点的联系,还能够利用整个观测场的信息对局部判断加以指导,从而更加合理地提取口标。本文从两个方而研究基于CRF的目标提取方法,一方而分析目标性质,提出适合口标提取的特征,另一方面改进基于CRF的口标提取框架,使之更充分地利用目标间的联系。本文的主要研究成果包含以下几点:提出一种快速的CRF模型推断方法。模型推断是使用训练过的CRF模型获取图像最优目标标记的过程。随着图像规模的增大,模型推断消耗的时间急剧增加。首先使用低分辨率图像推断,由于像素数目少,收敛时间有效缩短,但是提取的目标比较粗糙;然后以低分辨率图像的模型推断结果为基础,在原始分辨率图像相应的边缘区域再次进行模型推断,从而获得比较精细的目标提取效果。算法在不明显降低目标提取精度的前提下,有效缩短了CRF模型的推断时间。提出一种融合不同尺度和方向的轮廓片段的CRF目标提取方法。边缘轮廓是最容易区分目标和背景的特征之一,将轮廓分解成多个片段可以更好地适应形变,将轮廓特征拓展到多种不同尺度能够适应不同大小目标的检测。匹配中,使用了铰链角度、轮廓方向以及偏Hausdorff距离选择候选轮廓位置。CRF将不同尺度、方向的候选轮廓片段有机结合在一起,有效地利用了片段之间的联系选择了最终轮廓。提出一种基于全局特征CRF的自然场景文字提取方法。利用边缘滤波结合开关映射提取出候选文字区域,改善了低对比度区域、噪声区域的候选提取效果。由于文字的大小、颜色、纹理变化较大,使用局部特征并不能很好地表示文字,本文使用当前节点和邻域内节点相似性作为全局特征。CRF将这些全局特征联系起来,并有效地提取出文字区域。提出一种基于两层CRF的文档图像文字提取方法。文字区域使用Gabor实部和虚部滤波时能够得到较强的滤波结果。将图像分割成大小相同的网格,取每个网格邻域的滤波结果的直方图作为特征,使用CRF分辨文字和背景区域。为了优化分辨结果,提出一种两层的CRF模型,将两类特征的分类结果融合,进一步提高了文字区域提取的准确性。提出一种CRY与支持向量机结合的手写字符提取方法。首先,提出一种基于开关映射的双阈值二值化方法,用来提取非均匀光照文档图像中的字符。接着,将整幅图像分割成大小相同的网格,避免直接处理手写字符和印刷字符粘连的情况。从每个网格的邻域中提取边缘共生矩阵作为特征,由于相邻网格特征的相似性,使用了CRF的分类框架将网格分成手写体和印刷体两类,在使用CRF的分类框架时,结合了支持向量机,使分类结果更加合理。最后,利用文本行信息的后处理获得更精细、意义更明确的分类结果。

全文目录


摘要  6-8
Abstract  8-10
目录  10-12
图索引  12-14
第1章 绪论  14-32
  1.1 目标提取研究现状  14-23
    1.1.1 目标提取的作用和意义  14-16
    1.1.2 目标提取的难点  16-18
    1.1.3 区分目标的特征  18-21
    1.1.4 目标提取方法的分类  21-23
  1.2 条件随机场概述  23-29
    1.2.1 马尔可夫随机场  23-25
    1.2.2 条件随机场  25-29
  1.3 本文主要工作  29-30
  1.4 本文内容安排  30-32
第2章 条件随机场的快速模型推断算法  32-51
  2.1 条件随机场的参数训练  32-34
  2.2 条件随机场的模型推断  34-36
  2.3 快速模型推断方法  36-50
    2.3.1 Grabcut算法简介  37-38
    2.3.2 基于快速Grabcut的目标提取算法  38-43
    2.3.3 快速的条件随机场模型推断算法  43-44
    2.3.4 实验结果  44-50
  2.4 本章小结  50-51
第3章 基于多尺度轮廓片段条件随机场的目标提取  51-65
  3.1 基于边缘特征的目标提取方法概述  51-54
  3.2 片段的获取和匹配  54-59
    3.2.1 样本轮廓片段  54-56
    3.2.2 候选片段选择  56-59
  3.3 基于条件随机场的片段选择  59-61
  3.4 实验结果  61-64
  3.5 本章小结  64-65
第4章 基于全局特征条件随机场的自然场景图像文字提取  65-83
  4.1 自然场景文字提取概述  65-69
  4.2 文字候选区域的提取  69-75
  4.3 基于条件随机场的文字区域选择  75-81
  4.4 实验结果  81-82
  4.5 本章小结  82-83
第5章 基于条件随机场的文档图像处理  83-109
  5.1 文字提取概述  83-87
  5.2 基于多条件随机场组合的文档图像的文字提取  87-100
    5.2.1 文字区域的特征  87-94
    5.2.2 条件随机场的文字提取  94-97
    5.2.3 多条件随机场的融合  97-98
    5.2.4 实验结果  98-100
  5.3 基于条件随机场的粘连手写体和印刷体的辨别  100-108
    5.3.1 文档图像的预处理  101-102
    5.3.2 手写体和印刷体分辨特征提取  102-104
    5.3.3 基于条件随机场框架的手写字符提取  104-106
    5.3.4 后处理  106
    5.3.5 实验结果  106-108
  5.4 本章小结  108-109
第6章 总结和展望  109-111
  6.1 本文工作总结  109-110
  6.2 研究展望  110-111
参考文献  111-120
致谢  120-121
攻读博士学位期间发表的学术论文  121

相似论文

  1. 基于统计方法的核磁共振人脑图像的分割及三维数据的分析,R445.2
  2. 基于空间—频率域的织物组织识别新技术研究,TS101.923
  3. 评价对象抽取研究,TP391.1
  4. 基于马尔可夫随机场模型的医学图像分割方法研究,TP391.41
  5. 肺部病灶感兴趣区域分割算法研究,TP391.41
  6. 汉语嵌套命名实体识别方法研究,TP391.1
  7. 二重组织织物的组织识别与真实感模拟研究,TS105
  8. 基于纹理的图像分割方法研究,TP391.41
  9. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  10. 基于内容的图像检索系统的研究与实现,TP391.41
  11. 基于空间邻域词袋模型的图像标注技术,TP391.41
  12. 非织造布疵点检测研究,TP391.41
  13. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  14. 基于结构先验的规则场景三维重建技术研究,TP391.41
  15. 基于目标和背景分离的活体荧光成像稀疏光谱分离,TP391.41
  16. 目标的快速检测、定位与运动分析,TP391.41
  17. 基于条件随机场的RNA二级结构预测算法,R346
  18. 基于字词联合解码的中文分词研究,TP391.1
  19. 特定领域中文术语抽取,TP391.1
  20. 无人驾驶智能车基于单目视觉的道路检测,TP391.41
  21. 生物医学文献中模糊限制语及其范围的检测,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com