学位论文 > 优秀研究生学位论文题录展示

基于音频的视频内容检索

作 者: 时金
导 师: 周军
学 校: 上海交通大学
专 业: 信号与信息系统
关键词: 视频检索 音频检索 音频分类 特征提取 HCMBVT FWDM
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 104次
引 用: 1次
阅 读: 论文下载
 

内容摘要


近年来,随着多媒体和网络技术的迅猛发展,数字视频信息出现了飞速膨胀。新的视频应用,例如视频邮件、视频点播、数字电视等,已经为越来越多的人所熟悉和接受。如何有效检索这些视频内容成为了研究的热点问题。与此同时,许多个人、团体以互联网为平台,通过音视频下载、流媒体广播等方式向社会发布各类信息。社会安全保障行动中,对信息的监控必不可少。如何对海量的实时流媒体视频进行有效的监控,及时发现、过滤出这些信息中包含的敏感、有害内容,对维护互联网空间和谐、乃至社会安定起着至关重要的作用。因此,流媒体视频内容实时性监测在国民经济和社会发展中有重大需求,是当今信息社会亟待解决的问题之一。然而,视频检索和流媒体内容监测技术面临着巨大挑战。目前许多视频检索网站(如Google Video等)以及流媒体点播网站(如YouTube.com等)基本采用的是基于媒体标题、标签关键字文字的检索和监控,即通过人们对视频的文字描述,把视频当作文档来处理。如何从视频内在的图像序列、音频信息、字幕中提取语义从而加以检索和监控具有很强的挑战和吸引力。同时,网络视频信息量非常大,并且还在急剧的膨胀中。如何能提高检索和监控的实时性和有效性,也成为影响基于内容的视频检索和监控技术应用于实际的至关重要的因素。本项研究工作就是在这样的背景下,探索了如何从音频检索角度出发,辅助基于内容的视频检索和流媒体监控,以提高其有效性和实时性。论文首先从音频模态进行视频内容检索的方法进行了探讨和分析,研究总结了基于音频的视频检索中音频特征的有效选取和门限值的确定,并通过实验,给出了一组有效的音乐特征以及门限值选取的方法;其次,在向量模板分类算法的基础上,提出了一种分层的向量模板分类算法(HCMBVT),通过分级分类,减少分类过程中的计算冗余,提高了分类效率;在此基础上,结合传统基于欧式空间距离的匹配算法,提出一种改进的前向加权序列匹配算法(FWDM),实验结果表明这两种算法可以有效地提高视频检索的实时性;通过实验探讨了基于音频的视频内容检索系统的优缺点及可行性。最后给出了实验结果及分析。

全文目录


摘要  4-5
ABSTRACT  5-9
第一章 绪论  9-16
  1.1 课题研究背景与意义  9-11
  1.2 国内外研究现状  11-13
  1.3 论文的主要研究成果和论文结构  13-16
第二章 基于音频的视频检索系统概述  16-24
  2.1 视频的结构化信息  16-17
  2.2 典型的多模态视频检索框架  17-19
  2.3 基于音频的视频流媒体内容检索框架  19-22
    2.3.1 基于文本和关键词的音频检索  20-21
    2.3.2 基于音频特征的音频检索  21-22
  2.4 本章小结  22-24
第三章 视频检索中的音频特征分析与提取  24-47
  3.1 音频特征的描述  24-38
    3.1.1 时域音频特征  25-29
    3.1.2 频域音频特征  29-32
    3.1.3 系数域音频特征  32-38
  3.2 音频特征分析和提取相关技术[31]  38-43
    3.2.1 音频短时处理技术  39-40
    3.2.2 同态处理技术  40-41
    3.2.3 预处理技术  41-43
  3.3 音频特征的选取及实验  43-45
  3.4 本章小结  45-47
第四章 视频检索中的音频分类与匹配  47-63
  4.1 音频分类算法  47-48
  4.2 音频匹配算法  48-49
  4.3 改进的分类和匹配算法  49-58
    4.3.1 分层的向量模板分类算法  49-53
    4.3.2 前向加权序列的匹配算法  53-54
    4.3.3 算法融合及系统设计  54-58
  4.4 实验结果及分析  58-62
  4.5 本章小结  62-63
第五章 总结与展望  63-65
  5.1 本文总结  63
  5.2 未来工作展望  63-65
参考文献  65-69
附录  69-73
  附录1:图片目录  69-70
  附录2:表格目录  70-71
  附录3:缩略语  71-73
致谢  73-74
攻读学位期间发表的学术论文目录  74

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 移动机器人视觉检测和跟踪研究,TP242.62
  14. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  15. 基于随机森林的植物抗性基因识别方法研究,Q943
  16. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  19. 红外图像目标识别及跟踪技术研究,TP391.41
  20. 水下目标特征的压缩与融合技术研究,TN911.7
  21. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com