学位论文 > 优秀研究生学位论文题录展示

跨媒体检索技术的研究

作 者: 王锦超
导 师: 侯加林
学 校: 山东农业大学
专 业: 农业电气化与自动化
关键词: 跨媒体检索 异构性 典型相关性
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 24次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在当前信息化和网络化迅速发展的社会,对跨媒体内容检索已经成为信息检索领悟中比较重要的研究热点。与传统信息检索不同的是,跨媒体信息检索的对象不是单一类型的多媒体对象,往往包括图像、声音以及视频等格式的数据。在研究跨媒体信息检索领域中,对于不同类型的多媒体信息检索处于尚不成熟的阶段。人们在对信息进行识别的过程中,往往需要对不同类型的信息进行感性认识,包括视觉、听觉等信息进行综合分析,形成整体认知。要实现这一点,需要对多媒体信息检索和管理的时候利用跨媒体信息检索方式进行比对。对于跨媒体检索技术的发展,离不开传统基于内容的多媒体检索技术。自从二十世纪九十年代以来,各种基于内容的多媒体检索技术将计算机视觉、模式识别、数据库技术以及机器学习等技术综合起来,形成多角度分析的机制,弥补了传统单一类型多媒体信息检索的弊端,大大提高了在大数据量情况下的信息检索的效率。跨媒体信息检索最初基于内容的检索技术,应用于对图像的各种信息进行提取,例如颜色,纹理,形状等特征向量作为图像索引的切入点。基于这种技术,可以转移到基于内容的视频和音频数据检索中,依然可以达到较为理想的效果。但是这些方法大多基于单一类型的多媒体数据作为检索对象,对于不同类型之间的数据往往不能实现交叉检索,例如利用音频数据与图像数据对比,可以实现人脸与语音双重识别问题。论文中对媒体底层特征的提取进行了详细研究,并利用PCA降维来缩小计算量。针对音频例子,采用MPEG实现音频数据的压缩,利用基于模糊C-均值聚类算法对聚类质心进行提取分析,借助Mel倒谱系数比较和计算,得到相似度结果;针对图像,利用小波变换提取图像边缘,分析图像中的颜色特征、纹理特征等,通过计算其7个不变矩组成表达这幅图像的特征向量,计算其距离函数得到相似度结果。本文的研究基于对单一类型多媒体数据的检索技术,实现跨媒体数据的综合检索。针对图像、音频等多媒体数据进行交叉比对,把数据底层最小粒度的特征进行向量化,借助相关矩阵的收敛运算,研究了图像与音频数据的跨媒体相关性分析,并通过对多媒体数据进行降维处理,并保持了相关性学习的持续性。

全文目录


中文摘要  7-8
Abstract  8-10
1 引言  10-15
  1.1 研究背景和意义  10-11
  1.2 国内外研究现状  11-13
    1.2.1 国内研究  11-12
    1.2.2 国外研究  12-13
  1.3 课题主要研究内容  13-14
  1.4 论文组成部分  14-15
2 总体方案的设计  15-16
3 多媒体特征的内容分析  16-27
  3.1 多媒体特征的提取  16-19
  3.2 PCA 降维  19-27
4 算法的设计  27-46
  4.1 基于模糊 C-均值聚类算法  27-32
    4.1.1 利用 MPEG 实现音频数据的压缩  27
    4.1.2 音频特征参数分析  27-28
    4.1.3 聚类质心提取  28-29
    4.1.4 归一化处理  29-30
    4.1.5 聚类质心 C 的计算  30
    4.1.6 聚类质心 C 的检验与矫正  30
    4.1.7 Mel 倒谱系数比较  30
    4.1.8 Mel 倒谱系数计算  30-31
    4.1.9 相似度比较  31
    4.1.10 结论分析  31-32
  4.2 小波变换提取图像边缘  32-40
    4.2.1 图像特征的分析  33-36
      4.2.1.1 颜色特征分析  33-34
      4.2.1.2 纹理特征分析  34-35
      4.2.1.3 形状特征  35-36
      4.2.1.4 空间关系特征分析  36
    4.2.2 小波变换提取图像边缘的原理  36-38
    4.2.3 计算不变矩特征值  38
    4.2.4 特征内部归一化  38-39
    4.2.5 距离计算  39
    4.2.6 小波模极大值结合多尺度不变矩法的图像检索算法  39-40
  4.3 向量空间模型  40-46
    4.3.1 向量空间模型的定义  40
    4.3.2 基于 VSM 的特征投影  40-41
    4.3.3 异构特征的典型相关性  41-42
    4.3.4 相似度计算方法  42-45
      4.3.4.1 距离函数计算分析  42-43
      4.3.4.2 相似度计算分析  43-45
    4.3.5 用户交互和相关反馈  45-46
5 系统的设计  46-51
  5.1 跨媒体检索系统框架  46
  5.2 ONTOLOGY 架构  46-47
  5.3 检索过程及其扩展  47-49
    5.3.1 跨媒体检索算法  47-48
    5.3.2 媒体与中心集的相似度计算  48-49
  5.4 用户反馈  49
  5.5 实验结果与分析  49-51
6 算法改进  51-55
  6.1 模糊 C 均值聚类算法的缺点分析  51-52
  6.2 遗传算法的设计  52-55
    6.2.1 种群个体的确定  52
    6.2.2 编码  52
    6.2.3 适应度函数设计  52
    6.2.4 遗传操作  52-53
    6.2.5 终止条件的确定  53-55
7 总结  55-56
参考文献  56-60
致谢  60-61
硕士研究生期间发表论文  61-62
附录  62-73

相似论文

  1. 空气质量监测系统异构设计与PM10灰预测,X851
  2. 面向“执行体”的实时交通控制系统建模与执行策略研究,TP273
  3. 远程控制系统智能计算传输技术和安全认证传输技术的实现,TP273
  4. 极大相关问题的数值方法,O212.4
  5. 基于PTOLEMY的无线数据采集系统的建模与设计,TP274.2
  6. 基于Ptolemy Ⅱ的MP3解码器的建模仿真研究,TN764
  7. 应用层组播NICE协议的改进与设计,TP393.04
  8. 基于异构特征统计分析的跨媒体检索研究,TP391.3
  9. 面向普适计算的情境感知体系研究与实现,TP338
  10. 服务于第四方物流企业的智慧型供应链构建研究,F259.23
  11. 语义网服务框架WSMO中介器的机理及应用,TP311.52
  12. 基于时空相关性的跨媒体检索模型研究与应用,TP391.3
  13. 数据集成中包装器的研究与实现,TP311.52
  14. 税银联网地税端子系统的设计与实现,TP311.52
  15. 基于元数据的武警指挥信息系统信息集成与建模技术研究,TP311.52
  16. 在大规模分布环境下数据的分布与复制及信息定位,TP311.52
  17. 跨媒体相似度机制研究和实现,TP391.41
  18. 面向对象的分布式冗余服务管理系统,TP315
  19. 基于CORBA和移动Agent的异构环境通信研究,TP393.09
  20. 基于相关性挖掘的跨媒体检索研究,TP391.3
  21. 大规模分布式环境下集群管理系统的研究与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com