学位论文 > 优秀研究生学位论文题录展示
局部描述特征结合概率潜在语义模型的场景分类技术研究
作 者: 戎怡
导 师: 胡正平
学 校: 燕山大学
专 业: 信号与信息处理
关键词: 场景图像分类 边缘改进局部二值模式特征(EILBP) 边缘改进中心对称二值模式特征(EICS-LBP) 统计边缘主色对特征 上下文语义信息 视觉词汇 概率潜在语义分析(PLSA)模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 66次
引 用: 1次
阅 读: 论文下载
内容摘要
场景图像分类研究是对包含若干语义信息的图像集合进行分类的过程,可以对海量图像进行有效浏览与检索,成为当今计算机视觉研究领域的一个核心问题。鉴于图像与文本的关联性,将文本的词包模型与潜在语义分析模型运用到场景图像描述与分类上,具有重要的研究意义。针对当前图像特征提取算法有效性与复杂性相互制约的问题,展开以下研究:首先,构建了基于灰度图像局部边缘稠密采样区域的边缘改进局部二值模式(Edge Improved Local Binary Pattern,EILBP)特征,算法简单,性能稳定,能够对边缘信息丰富的图像进行合理描述,结合概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)模型完成场景分类,实验结果表明该特征提取算法应用在场景图像分类是有效的。然后,在EILBP特征的基础上,根据对称性构建了图像局部区域的边缘改进中心对称二值模式(Edge Improved Center Symmetric Local Binary Pattern,EICS-LBP)特征;针对彩色图像的颜色信息,构建了统计边缘主色对特征描述局部区域的边缘主色对信息;然后结合扩展PLSA模型完成场景分类,实验结果表明该方法具有较好的分类性能,对具有边缘轮廓的彩色图像分类精度高。最后,针对传统的视觉单词没有考虑特征间的依赖关系,不能充分表达图像主题这一问题,在彩色图像的EICS-LBP与统计边缘主色对特征的基础上,构造了一种含有上下文信息的视觉特征,之后结合扩展的PLSA模型实现场景分类。实验结果表明该方法具有较好的分类性能,对上下文信息丰富,具有边缘轮廓的彩色图像分类性能较好。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-15 1.1 课题背景及意义 9-10 1.2 国内外研究现状 10-13 1.3 本文研究内容及创新点 13-14 1.4 本文组织结构 14-15 第2章 基于文本主题分析理论的场景分类模型 15-23 2.1 基于文本主题分析理论的场景分类基础 15-16 2.2 词包模型的基本理论 16-17 2.3 潜在语义提取模型的基本理论 17-22 2.3.1 PLSA 模型建立的原理 17-20 2.3.2 PLSA 模型的优缺点 20-21 2.3.3 LDA 模型 21-22 2.4 本章小结 22-23 第3章 基于EILBP 视觉特征结合PLSA 模型的场景分类算法 23-34 3.1 引言 23-24 3.2 系统组成 24-25 3.3 EILBP 视觉特征的形成 25-27 3.4 图像词包模型与基于PLSA 模型潜在语义提取 27-28 3.4.1 图像的词包模型 27 3.4.2 基于PLSA 模型的潜在语义提取 27-28 3.5 实验仿真 28-33 3.6 本章小结 33-34 第4章 基于EICS-LBP 与统计边缘主色对视觉特征的场景分类算法 34-52 4.1 引言 34-35 4.2 系统组成 35-36 4.3 EICS-LBP 与统计边缘主色对视觉特征的形成 36-40 4.3.1 EICS-LBP 特征的形成 36-38 4.3.2 统计边缘主色对特征的形成 38-40 4.4 图像的词包模型与基于扩展PLSA 模型潜在语义提取 40-42 4.4.1 图像的词包模型 40 4.4.2 基于扩展PLSA 模型的潜在语义提取 40-42 4.5 实验仿真 42-51 4.6 本章小结 51-52 第5章 基于上下文语义结合扩展PLSA 模型的场景分类算法 52-61 5.1 引言 52-53 5.2 系统组成 53-55 5.3 含有上下文语义信息视觉特征的形成 55-57 5.3.1 上下文归一化交互序列的形成 55-56 5.3.2 视觉特征的形成 56-57 5.4 图像的词包模型与基于扩展PLSA 模型潜在语义提取 57 5.5 实验仿真 57-60 5.6 本章小结 60-61 结论 61-63 参考文献 63-68 攻读硕士学位期间承担的科研任务与主要成果 68-69 致谢 69-70 作者简介 70
|
相似论文
- 基于语义绑定的分层视觉词汇库的图像理解算法研究,TP391.41
- 基于概率潜在语义分析的图像场景分类,TP391.41
- 基于概率隐语义分析的人脸识别,TP391.41
- 基于仿射传播聚类算法的词汇树生成研究,TP391.41
- 基于词汇树的图像检索技术研究,TP391.41
- 文化熟悉度和篇章视觉词汇量对外语阅读中词汇附带习得的影响,H319
- 阅读水平、视觉词汇、内容图式对附带词汇习得的影响研究,H319.3
- 词汇初期加工(识字)在英语阅读中的作用,H319
- 针对初中英语学习困难生进行词汇识别策略教学的研究,G633.41
- 汉英视觉词汇认知语义对比研究,H313
- 场景图像内容表述和分类研究,TP391.41
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 图像拼接技术研究,TP391.41
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 空中目标与背景的红外图像仿真技术研究,TP391.41
- 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
- 双传感器图像联合目标检测及系统实现研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|