学位论文 > 优秀研究生学位论文题录展示
文档图像的版面分析技术研究
作 者: 施晟
导 师: 罗三定
学 校: 中南大学
专 业: 计算机科学与技术
关键词: 文档图像 版面分析 版面分割 区域类型识别
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 48次
引 用: 0次
阅 读: 论文下载
内容摘要
文档图像的版面分析是文档信息处理系统的重要组成部分,以及复杂文档OCR必不可少的环节,它是实现纸质文档数字化的重要环节。版面分析技术广泛应用于文档自动检索、办公自动化等领域,但由于文档版面类型多样,结构复杂,目前的版面分析技术仍具有较多局限性,因此版面分析具有重要的意义及应用前景。版面分析主要包括版面分割以及区域类型识别两大部分。针对传统的自顶向下方法难以适应复杂版面的问题,本文提出一种基于分割线提取的版面分割算法。该算法首先分别在水平和垂直方向上提取长度及宽度大于一定阈值的初始分割线,并针对固定阈值法适应性不强的问题,提出一种自适应阈值计算方法;然后将初始分割线聚类成线簇,为解决线簇形状复杂、主轴方向难以确定的问题,采用分层聚类方法,使得线簇形状得以简化,并采用一定策略提取出线簇主轴线作为最终分割线;然后对各分割线所形成的交点构建关系模型,并基于该模型采用闭合框搜索算法分割出各版面区域;最后通过区域的筛选及合并处理增强分割结果的有效性。针对现有方法在同一层次考察各项目标属性识别效率不高的问题,本文提出一种基于特征属性的层次识别算法。该算法首先通过样本统计得到各类目标的各项属性概率分布,并引入属性区分力的概念,表达属性区分目标的能力,由此构建目标属性表,识别过程中每次提取当前区分力最大的属性,并计算目标概率,实现一种逐步提取属性并确定目标归属直至最终确定目标类型的层次识别过程。本文针对版面分割所得到的文档区域构建了3*5大小的目标属性表,采用该算法较好地实现了版面区域的识别。经过综合实验分析,本文所提出的版面分析方法对于不同的版面类型以及拍摄条件均具有较好的适应性,并且具有较高的分割率与识别率。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 绪论 9-15 1.1 研究背景 9-10 1.2 研究现状 10-13 1.2.1 版面分析 10-11 1.2.2 版面分割 11-12 1.2.3 区域类型识别 12-13 1.3 主要研究工作 13-14 1.4 论文章节安排 14-15 第二章 版面结构建模与总体技术路线 15-23 2.1 版面层次结构 15-17 2.1.1 几何结构 15-16 2.1.2 逻辑结构 16-17 2.2 文档结构建模 17-19 2.2.1 DPLM模型 17-18 2.2.2 改进的DPLM模型 18-19 2.3 总体技术路线 19-22 2.3.1 改进的自顶向下分割方法 19-21 2.3.2 基于特征属性的层次识别方法 21-22 2.4 本章小结 22-23 第三章 基于分割线提取的版面分割 23-40 3.1 初始分割线提取 23-28 3.1.1 预处理 23-24 3.1.2 固定阈值分割线提取 24-26 3.1.3 自适应阈值分割线提取 26-28 3.2 线簇主轴线提取 28-33 3.2.1 线簇层次结构分析 28-29 3.2.2 初始分割线聚类 29-30 3.2.3 子线簇筛选及聚类 30-32 3.2.4 主轴线提取策略 32-33 3.3 有效区域搜索 33-39 3.3.1 交点关系模型 33-35 3.3.2 闭合框搜索 35-37 3.3.3 区域合并及筛选 37-39 3.4 本章小结 39-40 第四章 基于特征属性的区域类型识别 40-53 4.1 基于特征属性的层次识别算法 40-43 4.1.1 基于VSM的目标识别 40-41 4.1.2 目标-属性表 41-42 4.1.3 快速层次识别算法 42-43 4.2 版面区域属性分析 43-49 4.2.1 版面区域分析 43-45 4.2.2 基于临界灰度的灰度属性分析 45-46 4.2.3 基于序贯滤波的区域属性分析 46-48 4.2.4 其它属性分析 48-49 4.3 版面区域类型识别 49-52 4.3.1 目标-属性表构建 49 4.3.2 属性区分力分析 49-50 4.3.3 层次识别过程 50-52 4.4 本章小结 52-53 第五章 实验分析 53-63 5.1 版面分割实验 53-56 5.1.1 版面类型适应性实验 53-55 5.1.2 光照适应性实验 55-56 5.2 区域类型识别实验 56-60 5.2.1 标题区域识别实验 56-58 5.2.2 正文区域识别实验 58-59 5.2.3 图像区域识别实验 59-60 5.3 综合实验及分析评价 60-62 5.4 本章小结 62-63 第六章 总结与展望 63-65 6.1 工作总结 63-64 6.2 工作展望 64-65 参考文献 65-70 致谢 70-71 攻读学位期间主要的研究成果 71
|
相似论文
- 低质量文档图像的二值化研究,TP391.41
- 文本图像处理与表格图像识别算法研究,TP391.41
- 基于OCR的支票识别系统的研究与实现,TP391.41
- 基于支撑笔画的视觉文档图像透视失真校正,TP391.41
- 基于复杂度的自适应中文版面分析方法研究,TP391.1
- 二值文档图像认证技术设计与实现,TP391.41
- 扫描文档图像纠偏技术应用研究,TP391.41
- 文本图像中Logo检测与识别技术的研究,TP391.41
- 复杂的中文文档图像版面分析研究,TP391.41
- 视觉文档图像光学失真的校正,TP391.41
- 面向内容认证的文档图像数字水印算法研究,TP391.41
- 基于特征的文档图像检索技术研究与应用,TP391.41
- 基于图文分割的文档图像数字水印算法研究,TP309.7
- 基于版面分析的文档图像检索算法研究,TP391.41
- 印刷体文档图像的中文字符识别,TP391.41
- 一种双栏文档图像偏斜校正的方法,TP391.41
- 文档图像拼接技术研究,TP391.41
- 基于文档图像特征的数字水印算法,TP309.7
- 印刷体中文文档识别系统的研究,TP391.43
- 文档图像识别中关键算法的研究与实现,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|