学位论文 > 优秀研究生学位论文题录展示

基于哼唱的音乐检索技术研究与实现

作 者: 鲁佳
导 师: 张明
学 校: 上海海事大学
专 业: 计算机软件与理论
关键词: 基于内容的音乐检索 哼唱检索 特征提取 基频 音频分割
分类号: TP391.3
类 型: 硕士论文
年 份: 2007年
下 载: 234次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着多媒体技术和网络的迅速发展,数字化的视频、音频信息已取代模拟视频、音频信息遍及INTERNET,如何从海量的数字信息中检索出我们需要的内容,是当前研究的热点问题之一。传统的音乐信息检索方法是基于曲名、作者、演奏者等等这样的属性。但这种方式并不是最理想的检索方式。这些信息本质上讲不是音乐内容本身,而是音乐的附属特征。一般情况下人们通过音乐的旋律特征来记忆音乐,所以很自然的想到利用哼唱歌曲旋律的方式来进行音乐的查找。基于内容的音乐检索技术是近年来的研究热点之一,它试图通过提取音频流中音高、音长等特征来表达和识别音乐的内容,并按照相似度量的方法检索音乐。其中最主要的两个问题是音乐特征提取和旋律的检索匹配。本文以音乐检索为背景,主要对哼唱容易发生的错误,音高的提取和检索算法进行了研究,在此基础上设计了一种音高提取方法,并从降低哼唱错误和特征提取不精确对检索的影响出发,提出了一种峰值对齐匹配算法。主要工作如下;(1)研究与检索相关的音乐知识。对声音的四要素,乐曲的定调规则,半音与声音频率的对应关系等进行了深入的研究,在此基础上总结了哼唱的音调与标准音调之间的差异。这些工作确定了提取何种特征,特征的量化,以及如何降低哼唱错误对检索的影响。(2)研究数字信号处理在特征提取中的应用。对时域分析和频域分析作了细致的分析和研究。由于歌曲声中混杂着人声、各种乐器声、掌声以及环境噪声等问题,因此设计了一种复杂声音环境下的主旋律音高提取算法。在音长提取方面,本文设计了一种不限定哼唱方式的音符分割方法,该方法也适用于从一般歌曲中提取的音高特征序列。因为两种算法的设计,使得本文所设计的原型系统中音乐库可以使用wav等格式的音乐,而非多数人使用的midi格式。(3)提出了峰值对齐匹配法。此算法与(U,D,R)算法,N-gram算法等字符串模糊匹配算法以及基于HMM的检索算法等统计模型的算法相比较属于轮廓比较算法。该算法可以较容易的降低哼唱中多种错误对检索过程的影响。算法速度优于以(U,D,R)算法为代表的部分字符串模糊匹配算法,也快于基于HMM模型的统计检索算法。实验结果表明,该算法是有效的,查询者绝大多数情况下能在查询结果的前几位找到查询的目标音乐。通过上述工作,证明了本文中算法的有效性,并建立了原型系统,实现了基于‘哼唱’的音乐检索。在基于内容的音乐检索方面进行了有益的探索和研究。

全文目录


摘要  3-5
ABSTRACT  5-9
第一章 绪论  9-13
  1.1 研究问题的提出  9-10
  1.2 国内外研究现状  10-11
  1.3 本文研究的主要问题及安排  11-13
第二章 基于内容的音乐检索系统  13-19
  2.1 音乐检索概述  13-15
  2.2 音乐特征处理过程  15-17
    2.2.1 音乐类音频文件的特征分析  15-16
    2.2.2 特征处理  16-17
  2.3 基于哼唱的音频检索系统结构  17-18
  2.4 本章小结  18-19
第三章 音乐检索中的相关音乐知识  19-24
  3.1 音乐概述  19
  3.2 声音的四个要素与音乐  19-23
    3.2.1 音强  19-20
    3.2.2 音高  20-22
    3.2.3 音色  22
    3.2.4 波形包络  22-23
  3.3 本章小结  23-24
第四章 信号处理与特征提取  24-41
  4.1 声音信号处理  24-32
    4.1.1 时域分析法  24-28
    4.1.2 语音的频域分析法  28-32
  4.2 旋律特征提取的实现  32-40
    4.2.1 音高提取  32-39
    4.2.2 音长提取  39-40
  4.3 本章小结  40-41
第五章 匹配算法  41-65
  5.1 音频检索技术的研究  41-52
    5.1.1 经典(U,D,R)算法的介绍与分析  41-44
    5.1.2 轮廓匹配算法的介绍与分析  44-46
    5.1.3 统计模型算法——基于HMM的算法的介绍与分析  46-52
  5.2 峰值对齐匹配算法的设计与实现  52-58
  5.3 峰值对齐匹配算法与前述匹配算法的比较  58-62
  5.4 峰值对齐匹配算法的实验与分析  62-64
  5.5 本章小结  64-65
第六章 总结与展望  65-67
  6.1 完成的主要工作  65
  6.2 进一步研究工作  65-67
参考文献  67-71
致谢  71

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 移动机器人视觉检测和跟踪研究,TP242.62
  14. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  15. 基于随机森林的植物抗性基因识别方法研究,Q943
  16. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  19. 红外图像目标识别及跟踪技术研究,TP391.41
  20. 水下目标特征的压缩与融合技术研究,TN911.7
  21. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com