学位论文 > 优秀研究生学位论文题录展示

图像文本提取系统设计及应用研究

作 者: 陈庆民
导 师: 杨小康
学 校: 上海交通大学
专 业: 电子与通信工程
关键词: 文本提取 Android OpenCV 终端软件 文本定位 MVC
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 184次
引 用: 0次
阅 读: 论文下载
 

内容摘要


文本是计算机视觉的许多应用中的一项重要特征。图像中的文本存有很多有用的信息,对视觉内容理解和获取至关重要。文本定位文本提取的一个重要步骤。文本提取的主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、利用及传输。其中关键点和难点就是准确快速的文本定位,原因在于自然场景的复杂多变性容易影响定位效果,且主流手机设备硬件资源也限制了现有的定位算法(基于区域、纹理、边缘的方法,或结合三类方法优点进行融合的方法)的实践应用。随着多媒体技术和智能手机设备的发展和普及,基于手机设备的文本分析也有了较大的需求,然而基于手机设备的图像处理技术没有通用的框架,本文是在没有成熟的算法和应用的背景下,进行一次探索性的研究和应用。本文主要针对基于Android智能手机设备自然场景文本分析进行研究,实现和改进了一种图像文本定位算法,可以准确快速地定位图像中的文本区域,同时提出一种基于SWT的图像二值化方法。在本文的文本定位算法中:第一,我们给出了输入图像SWT(笔划宽度变换)的详细步骤,并改进了滤波的过程,计算复杂度与边缘像素呈线性关系,具有计算简单的优点;第二,在笔划宽度变换的基础上提出了中文合并算法,解决了传统合并算法处理中文合并时效果不甚理想的问题,基于SWT(笔划宽度变换)提出一种图像二值化方法。同时,本文又重点研究了在Android平台上文本定位程序的开发:第一,考虑到手机设备的硬件条件,利用和修改了其中的一些模块,应用OpenCV图像处理函数库,实现了图像文本提取系统的核心模块——文本定位模块;第二,应用MVC软件设计模式并实现了基于Android平台的文本定位终端软件。并通过ICDAR和本文的数据集,检测了算法的定位效果。本文的设计思想和方法对文本定技术研究和产品开发具有一定的参考价值。

全文目录


摘要  3-5
ABSTRACT  5-9
第一章 绪论  9-17
  1.1 智能终端及移动手机平台文本图像分析现状  9
  1.2 基于移动手机平台的文本识别的目的和意义  9-10
  1.3 文本定位研究现状  10-13
    1.3.1 基于区域的文本定位方法  11
    1.3.2 基于纹理的文本定位方法  11-12
    1.3.3 基于边缘的文本定位方法  12-13
    1.3.4 其它文本定位方法  13
  1.4 文本图像语义提取相关  13-15
  1.5 本文的研究内容与组织结构  15-16
  1.6 本章小结  16-17
第二章 Android 平台开发介绍  17-23
  2.1 Android 平台的介绍  17
  2.2 Android 平台的特征  17-19
  2.3 Android 平台的组成  19-22
    2.3.1 Linux 内核  19-20
    2.3.2 系统运行库  20-21
    2.3.3 应用程序框架  21-22
    2.3.4 应用程序  22
  2.4 本章小结  22-23
第三章 文本图像识别系统及文本定位算法  23-57
  3.1 文本提取系统概要及文本定位算法分析  23-25
  3.2 改进的笔划宽度变换  25-35
    3.2.1 预处理  26-27
    3.2.2 边缘检测  27-30
    3.2.3 获取梯度信息  30-31
    3.2.4 笔划宽度赋值  31-34
    3.2.5 形态学滤波  34-35
  3.3 连通区域分析  35-39
  3.4 连通域特征提取  39-42
  3.5 改进的连通域过滤过程  42-43
  3.6 中文合并算法  43-46
    3.6.1 字内合并算法  44
    3.6.2 字间合并算法  44-46
  3.7 文本定位算法性能分析  46-53
    3.7.1 算法性能评价标准  46-47
    3.7.2 数据库的建立与性能评价  47-53
  3.8 基于SWT 的文本图像二值化方法  53-56
    3.8.1 阈值分割及二值化  54
    3.8.2 基于SWT 的阈值分割  54-56
  3.9 本章小结  56-57
第四章 基于Android 的文本提取系统的设计与实现  57-81
  4.1 Android 应用程序层次分析  57-60
    4.1.1 Activity 介绍  58-59
    4.1.2 Service 介绍  59
    4.1.3 BroadcastReceiver 介绍  59
    4.1.4 ContentProvider 介绍  59-60
    4.1.5 Intent 介绍  60
  4.2 文本提取系统终端软件功能分析  60-63
    4.2.1 智能手机文本提取系统  60-62
    4.2.2 终端软件非功能性需求  62-63
  4.3 图像获取实例  63-65
  4.4 OpenCV 移植模块的实现  65-70
    4.4.1 JNI 本地调用  65-67
    4.4.2 OpenCV 移植模块的具体实现  67-70
  4.5 基于MVC 模式的Android 文本定位终端的实现  70-80
    4.5.1 MVC 设计模式在传统应用程序设计中的应用  70-71
    4.5.2 基于MVC 模式的Android 程序的应用  71-73
    4.5.3 Android 图像文本提取系统主要功能介绍  73-74
    4.5.4 Android 图像文本提取系统的设计实现  74-80
  4.6 本章小结  80-81
第五章 总结与展望  81-83
参考文献  83-89
致谢  89-91
攻读硕士学位期间已发表论文  91-93

相似论文

  1. 在智能手机环境下健康管理功能设计与研究,TN929.53
  2. 基于ANDROID的H.264视频编解码技术的研究与实现,TN919.81
  3. 基于SOA与工作流的OA系统的研究与实现,TP311.52
  4. 基于改进光流场模型的医学图像非刚性配准算法研究及实现,TP391.41
  5. 基于Java EE框架的公文传输系统设计与实现,TP311.52
  6. OpenBASE企业管理器设计与实现,TP311.52
  7. 基于Struts2的校友管理与服务系统的设计与实现,TP311.52
  8. 基于3G网络的智能交通视频监控系统的设计与实现,TP391.41
  9. 行为分析中人眼视线估计方法的研究,TP391.41
  10. 基于Google云计算平台的Web应用系统设计及实现,TP393.09
  11. 基于Android平台的个人移动地图应用,TP393.09
  12. 停车诱导在智能移动终端上的设计与实现,TN929.53
  13. 基于Davinci技术的车辆检测与跟踪算法的研究与实现,TP301.6
  14. 基于Android平台的无线控制系统设计与实现,TP273
  15. 基于Android的多跳无线网络通信软件的设计与实现,TN929.5
  16. 基于Android的工程导航系统设计,TN929.5
  17. 一个电子报纸发行系统的设计和实现,TP311.52
  18. 基于Android平台的无线点菜系统的设计与实现,TP311.52
  19. 运动目标识别视频监控系统设计与实现,TP391.41
  20. 远程实时心电监护系统的设计与实现,TP277
  21. 高校人力资源信息管理系统的设计和实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com