学位论文 > 优秀研究生学位论文题录展示

应用于多功能打印机的自动文档提取打印算法研究

作 者: 李琳
导 师: 赵群飞;稽晓
学 校: 上海交通大学
专 业: 控制工程
关键词: 多功能打印机 霍夫变换 矩形检测 文档提取
分类号: TP334.8
类 型: 硕士论文
年 份: 2009年
下 载: 11次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着高科技的发展,现在有越来越多获取信息的方式,比如数码相机,摄像头,带拍照功能的手机等,它们都是非常有效的一种获取信息的方式。人们如果想把他们所拍摄的材料打印出来,由于拍摄的文件图像通常是从某一个角度获取的,而且包含一些不需要的背景信息。打印这些不需要的信息,并不是用户所需要的,同时,如果把由于拍摄角度引起的畸变校正过来,会得到一个更加好的打印效果。多功能打印机作为一种集成了打印,复印,传真等一系列功能的办公设备,采用了比较先进的硬件解决方案,可以应对高级的,智能的嵌入式软件需求,为本文提出的算法提供了硬件基础。同时为了方便用户的处理,打印机设计采用了更加方便的触摸屏方案,在触摸屏的显示界面上,采用了一键式的处理方式,即用户只需要点击一下处理键,系统便对当前文档进行校正,完成所有的处理后,按指令打印,或者传真,或者复印出处理后的文档。同时系统可以处理不同的色彩空间,可以处理及输出彩色,使系统的应用更加广泛。系统背后的处理,本文提出了基于数字图像处理的自动文件提取算法。这种自动文件提取算法,首先采用了边缘检测算法检测检测出图像的边界信息,为了有效的检查出图像的边缘,本文采用了Canny检测算法用于检测;由于有些边界是多余信息,为了有效去除它们,进行了相对简单的轮廓提取[3],保留大的轮廓信息,去除小的轮廓信息;然后对检测到的轮廓信息进行直线检测,本文中采用了hough变换,找出文件的四个顶点位置,从而定位出文件在图片中的区域;为了确定文档的尺寸,再通过文件顶点的坐标根据针孔模型,确定转换后平行四边形的纵横比;最后通过仿射变换运用双线性插值校得到一个平行四边形的文件图片,用于打印。在本文中,为了建议算法的可靠性,做了大量的测试,处理的图像有拍摄德图书馆的书籍,有墙上的海报,有传单等等。进行了大量实验并取得了很好的效果。产生错误结果的图像,也进行了分析,可以通过手动方法来进行改善。总之,算法有很强的可行性。

全文目录


摘要  5-7
ABSTRACT  7-12
第一章 绪论  12-17
  1.1 引言  12
  1.2 课题的研究背景、现状和意义  12-14
    1.2.1 背景概述  12-13
    1.2.2 发展现状  13
    1.2.3 课题研究意义  13-14
  1.3 本文概述  14-16
    1.3.1 问题描述  14-15
    1.3.2 论文总体思路与结构安排  15
    1.3.3 论文组织结构  15-16
  1.4 本章小结  16-17
第二章 系统组成结构  17-23
  2.1 用户界面  17-18
  2.2 色彩处理  18-20
    2.2.1 三原色(R,G,B)  18-19
    2.2.2 YCC 色彩空间  19
    2.2.3 Lab 颜色空间  19
    2.2.4 CMY 色彩空间  19-20
    2.2.5 打印机中的色彩空间  20
  2.3 软件结构  20-22
    2.3.1 图像处理库  21
    2.3.2 测试样本  21-22
  2.4 本章小结  22-23
第三章 基于数字图像处理的文档提取  23-44
  3.1 提取文档流程  23
  3.2 图像增强  23-28
    3.2.1 图像增强基础  23-24
    3.2.2 直方图均衡化  24-28
    3.2.3 直方图均衡化处理结果  28
  3.3 边缘检测  28-36
    3.3.1 边缘模型  28-34
    3.3.2 边缘检测结果对比  34-36
  3.4 确定文档顶点  36-42
    3.4.1 霍夫变换  36-37
    3.4.2 轮廓提取  37-42
  3.5 矩形检测  42-43
  3.6 本章小结  43-44
第四章 对变形文档的校正  44-56
  4.1 像素间的关系  44-46
    4.1.1 相邻像素  44
    4.1.2 邻接性、连通性、区域和边界  44-46
  4.2 标定  46-50
    4.2.1 相机模型  46-48
    4.2.2 坐标系  48-49
    4.2.3 图像数字化  49-50
  4.3 计算纵横比  50-52
  4.4 仿射变换  52-53
  4.5 插值  53-55
    4.5.1 最接近原则插值(Nearest Neighbor Interpolation)  53
    4.5.2 双线性插值(Bilinear Interpolation)  53
    4.5.3 双三次插值(Bicubic interpolation)  53
    4.5.4 不规则碎片形插值(Fractal interpolation)  53-54
    4.5.5 比较  54-55
  4.6 本章实验结果  55
  4.7 本章小节  55-56
第五章 实验结果和分析  56-59
  5.1 测试环境  56
  5.2 实验结果  56-58
  5.3 本章小节  58-59
第六章 总结  59-61
  6.1 总结  59
  6.2 展望  59-61
参考文献  61-64
致谢  64-65
攻读硕士学位期间已发表或录用的论文  65

相似论文

  1. 基于GHT的RFID芯片贴装视觉定位技术研究,TN405
  2. 水下目标的视觉检测与识别,TP391.41
  3. 工业应用中的目标检测与精确定位技术,TP391.41
  4. 运动与离焦模糊图像的复原,TP391.41
  5. 基于图像特征的车型识别,TP391.41
  6. 基于显著图的交通标志检测方法研究,TP391.41
  7. 基于红外热图像的架空输电线路故障检测软件开发,TM755
  8. 视觉导引AGV的自动驾驶系统,TP391.41
  9. 基于视觉的行车道检测系统研究,TP274
  10. 基于多Agent及元搜索技术的中文问答系统的研究和应用,TP391.1
  11. 基于图像处理的流感疫苗血凝素含量测量技术研究,TP391.41
  12. 基于多测距仪的UUV结构环境SLAM方法研究,TP242
  13. 基于机器视觉的指针式仪表识别技术研究与应用,TP391.41
  14. 智能驾驶视觉辅助技术的研究,TP391.41
  15. 复杂环境下多目标图像分割算法研究,TP391.41
  16. 海面运动舰船检测算法研究,TP391.41
  17. 基于迈克尔逊干涉仪的全息曝光稳定性监控系统,TP277
  18. 全文检索引擎应用于邮件的设计与实现,TP391.3
  19. 基于霍夫变换及条件概率模型的多目标检测,TP391.41
  20. 基于智能车辆视觉导航的道路检测技术的研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 外部设备 > 打印装置
© 2012 www.xueweilunwen.com