学位论文 > 优秀研究生学位论文题录展示

基于多示例学习的图像检索与推荐相关算法研究

作 者: 李展
导 师: 彭进业
学 校: 西北大学
专 业: 计算机软件与理论
关键词: 多示例学习 图像分类 图像检索 图像推荐 SIFT核函数
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 270次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网上的图像数量呈几何级数快速增长,快速有效地寻找所需的图像变得越来越困难。利用语义进行图像的组织、检索和推荐,可以提高图像的获取效率,因此是计算机视觉的一个重要研究方向。本文将机器学习中的多示例学习框架应用到粗粒度的语义图像检索和推荐中,并对与此相关的一些关键技术进行了探索性研究,研究内容包括SIFT核函数、图像聚类、分类、检索和推荐等技术。论文的主要创新点有:(1)针对图像SIFT (Scale-Invariant Feature Transform)特征的集合性、位置互异性,提出了一种新的AMK (Angle Matching context Kernel)核函数。首先计算图像SIFT集合的平均SIFT向量,基于角度相似性选择SIFT的配对点,然后选用SIFT配对点的邻域作为其上下文,累加平均SIFT向量相似性、SIFT配对点和上下文的相似性作为AMK核函数的值。从理论上证明了构造的AMK函数符合核函数的Mercer条件,在CaltechlOl和Caltech256上的实验结果也表明AMK核函数相对于上下文依赖核(Context-dependent Kernel)和多解析直方图核(Pyramid Kernel)是有效的。(2)针对已有BAMIC (BAg-level Multi-Instance Clustering)算法对于噪声比较敏感问题,提出了一种新的多示例聚类算法—ECMIL (Earth mover’s distance Clustering of Multi-Instance Learning)算法。首先基于示例的欧式距离将相似示例合并,然后利用包的示例计算包的推土机距离,最后使用k-medoids算法聚类。在基准数据集MUSK、Corel和SIVAL上进行的实验表明,ECMIL算法具有良好的聚类性能。(3)基于多示例学习的三个假设(正示例聚集性、包结构性和示例对包标签影响概率性)提出了CK_MIL和ck_MIL两种算法。首先使用K均值聚类算法分别在正负示例集合上聚类,选择包内正示例并计算包的结构,然后CK_MIL直接将包内正示例和包结构组成一个新的向量,使用RBF计算包的相似性,而ck_MIL则引入一个概率参数平衡两者对包相似性的影响,最后采用SVM进行分类。在基准测试数据集和图像数据库上的实验表明,CK_MIL和ck_MIL两种算法可有效提高图像分类精度。(4)针对对象图像检索问题,提出了一种新的SCAMK-MIL (Spectral Clustering and Angle Matching context Kernel for Multi-instance Learning)图像检索算法。该算法将图像当作包,分割区域的视觉特征当作包中的示例,首先采用谱聚类方法获取包的正示例,然后分别利用RBF核函数和AMK核函数计算潜在正示例和其它示例的相似性,最后使用SVM和相关反馈进行图像检索。在SIVAL图像集上进行的实验表明该方法是有效的。(5)将多示例学习引入图像推荐领域,提出了一个新的对象图像推荐问题。针对该问题,首先研究了基于多示例学习的经典DD算法和传统余弦相似性相结合的DD_RS推荐算法,其次基于图像的颜色、纹理、形状和局部特征,使用改进的ck_MIL算法,提出了一个新的CKMIL_RS推荐框架。在SIVAL和Caltech101评分矩阵上进行的实验,验证了两个方法可以提高推荐性能。

全文目录


摘要  3-5
Abstract  5-7
目录  7-10
第一章 绪论  10-19
  1.1 课题研究背景与意义  10-14
  1.2 课题研究基础  14-16
  1.3 论文成果及内容安排  16-18
    1.3.1 本文工作的主要贡献和创新  16-17
    1.3.2 论文结构  17-18
  1.4 本章小节  18-19
第二章 国内外相关研究现状分析  19-37
  2.1 多示例学习  19-30
    2.1.1 多示例学习的起源  19-21
    2.1.2 多示例学习与传统机器学习的区别  21-22
    2.1.3 多示例学习分类算法及存在问题  22-30
  2.2 多示例学习的图像分类和检索  30-33
  2.3 图像推荐及相关方法研究  33-36
  2.4 本章小节  36-37
第三章 基于角度匹配和上下文依赖的SIFT核函数  37-58
  3.1 SIFT局部特征提取方法  37-40
  3.2 SIFT核函数的数学模型  40-41
  3.3 SIFT核函数比较及分析  41-45
  3.4 AMK核函数构造方法  45-53
    3.4.1 AMK核函数算法框架  45-46
    3.4.2 相关定义和定理  46-49
    3.4.3 获取平均SIFT向量和SIFT配对点  49-51
    3.4.4 构建SIFT核函数  51-53
  3.5 实验结果与分析  53-57
    3.5.1 实验一  53-56
    3.5.2 实验二  56-57
  3.6 本章小结  57-58
第四章 基于EMD距离的多示例图像聚类算法  58-67
  4.1 引言  58-59
  4.2 基于EMD距离的MIL聚类方法  59-64
    4.2.1 多示例聚类问题描述  59
    4.2.2 BAMIC算法及存在问题  59-60
    4.2.3 改进EMD距离  60-63
    4.2.4 ECMIL算法  63-64
  4.3 实验结果与分析  64-66
    4.3.1 Musk数据集  64-65
    4.3.2 Corel和SIVAL数据集  65-66
  4.4 本章小结  66-67
第五章 基于正示例选择的多示例图像分类算法  67-80
  5.1 引言  67-68
  5.2 CK_MIL和ck-MIL算法  68-74
    5.2.1 本节方法综述  68-70
    5.2.2 获取包内正示例  70-72
    5.2.3 计算包结构  72-73
    5.2.4 多核和ck_MIL核  73-74
  5.3 实验结果与分析  74-79
    5.3.1 k值影响分析  75
    5.3.2 基准测试数据集  75-77
    5.3.3 图像数据集  77-78
    5.3.4 算法效率分析  78-79
  5.4 本章小结  79-80
第六章 基于谱聚类多示例学习的对象图像检索算法  80-95
  6.1 引言  80-82
  6.2 基于多示例学习的图像检索框架  82-83
  6.3 基于SCAMK_MIL的图像检索算法  83-89
    6.3.1 正示例代表的选择  83-86
    6.3.2 SCAMK_MIL核函数的计算  86-88
    6.3.3 SVM分类及相关反馈  88-89
  6.4 实验结果与分析  89-94
    6.4.1 图像库及实验方法  89-90
    6.4.2 参数k和α对算法性能的影响  90-91
    6.4.3 实验结果及分析  91-94
  6.5 本章小结  94-95
第七章 基于多示例学习的对象图像推荐算法  95-109
  7.1 引言  95-97
  7.2 DD_RS推荐算法  97-101
    7.2.1 多示例学习的图像推荐  97
    7.2.2 多示例用户相似性计算  97-99
    7.2.4 组合推荐  99-100
    7.2.5 实验结果与分析  100-101
  7.3 CKMIL_RS推荐算法  101-108
    7.3.1 图像底层特征提取  102-105
    7.3.2 多示例用户相似性计算  105-107
    7.3.3 实验结果与分析  107-108
  7.4 本章小结  108-109
第八章 总结与展望  109-113
  8.1 工作总结  109-110
  8.2 未来工作展望  110-113
参考文献  113-134
致谢  134-135
攻读博士学位期间的研究成果  135-136

相似论文

  1. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  2. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  3. Q学习在基于内容图像检索技术中的应用,TP391.41
  4. 基于内容的服装图像检索技术研究及实现,TP391.41
  5. 基于多示例学习的用户关注概念区域发现,TP391.41
  6. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  7. 多样性密度学习算法的研究与应用,TP181
  8. 基于内容的唐卡图像检索技术研究,TP391.41
  9. 图像感兴趣区域提取方法研究,TP391.41
  10. 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
  11. 基于“词袋”模型的图像分类系统,TP391.41
  12. 基于纹理特征的图像分类研究,TP391.41
  13. 极化SAR图像精细地物分类方法研究与实现,TN957.52
  14. 光照不变性特征在图像检索与识别中的应用研究,TP391.41
  15. 基于内容的大规模数字图像检索技术研究,TP391.41
  16. 基于脑波的情感图像检索的研究,TP391.41
  17. 基于草图的图像检索技术研究与系统实现,TP391.41
  18. 多模式图像检索方法研究,TP391.41
  19. 基于内容的商品图像分类技术研究,TP391.41
  20. 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
  21. 票据图像分类的技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com