学位论文 > 优秀研究生学位论文题录展示
基于特征的文档图像检索技术研究与应用
作 者: 范红梅
导 师: 王希常
学 校: 山东师范大学
专 业: 管理科学与工程
关键词: 文档图像检索 分层密度特征 Sift特征 关键块特征 段落结构特征 聚类金字塔树 相关反馈
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 60次
引 用: 0次
阅 读: 论文下载
内容摘要
文档图像检索是图像检索的一个重要分支,它在电子档案管理、数字图书馆、办公自动化等方面应用广泛。文档图像检索的目标是从文档图像数据库中找到满足要求的一幅或多幅图像。常见的文档图像检索算法可以分为基于版面重建的文档图像检索和基于图像特征的检索两大类。在基于特征的文档图像检索中,对于文档图像这类特殊图像很难以颜色和纹理视觉特征来表示文档图像,同时也很难以从整体上提取的特征来表示文档图像的内容,所以基于特征的文档图像检索的关键技术之一是如何提取特征,如何计算特征的相似度。本文分析了现有基于特征的文档图像检索方法的优缺点,在此基础上,沿用基于特征的文档图像检索的基本思路,将文档图像的全局特征和局部特征相结合,给出了一种新的文档图像检索方法。首先对图像进行预处理,包括去噪、二值化和倾斜检测等。本文采用中值滤波方法去除椒盐噪声,使用一种简单的快速扫描方法去除黑边噪声;使用Bernsen算法对图像进行二值化处理,然后采用一种快速倾斜角度检测算法检测文档图像倾斜度,再利用快速旋转算法旋转校正图像。之后再对整个文档图像定义和提取有效区域的宽和高、分层密度特征、Sift特征。然后利用最大梯度差方法将文档图像分割成文字区域和非文字区域。对文字区域提取连通体对之间的距离(字间空白)、连通体高度、宽度等局部特征,连通体的个数、空穴个数、平均空白、平均连通体高度、平均连通体宽度和段落结构特征等全局特征。对非文字区域借鉴方块编码的思想提取关键块特征。其中分层密度特征同时包含文档图像的全局特征和局部特征,具有良好的区分度;Sift特征是文档图像的局部特征,它对旋转、尺度缩放、扭曲变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性,是一种对文档图像具有高鲁棒性的特征。文字区域特征是较低层次的特征,能较好的区分文档图像。非文字区域的关键块特征也已经被证明具有良好的区分度。提取的特征既包含了全局特征也包含了局部特征,既包括高层次特征也包含低层次特征。因此,它们的组合能充分表征文档图像。将这些特征按照性质和特征向量长度分成三个组。然后本文引入已经证明查询效率不会随维数增加而降低的聚类金字塔树来组织这些数据,对三个组分别建立高维索引聚类金字塔树。通过分别查询这三个聚类金字塔树得到三个图像集合,取并集从而得到候选图像集合,然后引入一种移动查询点的相关反馈算法提高检索准确度。本文的方法对手写体文档图像,印刷体文档图像和两者混合的文档图像均适用。最后,在包含4300张文档图像的数据库上对基于综合特征的检索进行了测试。实验表明:本文的方法具有普适性和较大的检索速度和较高的查全率和查准率,具有较强的实用价值。
|
全文目录
摘要 6-8 ABSTRACT 8-11 第1章 绪论 11-18 1.1 图像检索 11-13 1.1.1 概述 11-12 1.1.2 基于内容的图像检索 12-13 1.2 文档图像检索 13-17 1.2.1 概述 13-14 1.2.2 国内外研究现状 14-17 1.3 本文的研究工作 17-18 第2章 文档图像特征提取与特征匹配 18-42 2.1 文档图像预处理 18-22 2.1.1 文档图像去噪 18-19 2.1.2 二值化 19-21 2.1.3 倾斜检测 21-22 2.2 文档图像特征定义和提取 22-40 2.2.1 针对整个文档图像的特征提取 26-32 2.2.2 文档图像的文字区域、非文字区域分割 32-35 2.2.3 文字区域的特征提取 35-38 2.2.4 非文字区域的特征提取 38-40 2.3 特征匹配 40-42 第3章 检索 42-54 3.1 多维索引 42-47 3.1.1 多维索引方法概述 42-44 3.1.2 聚类金字塔树 44-47 3.2 相关反馈技术 47-52 3.2.1 概述 47-48 3.2.2 基于贝叶斯理论的相关反馈 48-52 3.3 检索 52-54 3.3.1 构造候选图像集合 52-53 3.3.2 从候选集合中得到查询结果 53-54 第4章 实验及分析 54-60 4.1 实验数据 54-55 4.2 性能评价指标 55 4.3 实验流程 55-56 4.4 实验 56-60 4.4.1 检索准确性实验及分析 56-59 4.4.2 检索时间 59-60 第5章 总结与展望 60-61 参考文献 61-66 致谢 66-67 攻读硕士学位期间发表的论文和参与的项目 67
|
相似论文
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
- 基于多幅图像的几何和纹理自动重建,TP391.41
- 基于SIFT特征和SVM的场景分类,TP391.41
- 微博客话题追踪及实时检索的相关研究,TP393.092
- 图像制导模拟器图像生成研究,TP391.41
- 动态场景下运动目标检测与跟踪,TP391.41
- 抗几何攻击图像水印算法研究,TP309.7
- 强化学习和相关反馈在口腔正畸图像检索中的应用,TP391.41
- 粒子群算法在查询优化中的应用,TP391.3
- 基于单摄像头的360度旋转跟踪系统,TP391.41
- 基于ROI的网格商空间多粒度图像检索,TP391.41
- 复杂场景下的视觉目标跟踪方法研究,TP391.41
- GPU通用计算与基于SIFT特征的图像匹配并行算法研究,TP391.41
- 综合多特征和SVM相关反馈的藻类图像检索技术研究,TP391.41
- 基于内容的监控视频检索关键技术研究,TP391.41
- 基于SIFT特征点提取的图像检索研究,TP391.41
- 基于点击数据分析的个性化搜索引擎研究,TP391.3
- 基于人工免疫系统的遥感图像检索算法研究,TP751
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|