学位论文 > 优秀研究生学位论文题录展示

基于哼唱的音乐检索系统

作 者: 鲁帆
导 师: 王民
学 校: 西安建筑科技大学
专 业: 计算机应用技术
关键词: 哼唱检索 音乐旋律 特征提取 旋律匹配 DTW
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 56次
引 用: 1次
阅 读: 论文下载
 

内容摘要


哼唱检索方式是一种方便、新颖、人性化的音乐检索方式,有着广泛的应用前景和重要研究价值。它使得用户在忘记歌词、歌名和作者的情况下,只要哼出旋律就可以找到想要的歌曲。本文针对哼唱音乐检索系统所涉及的关键技术进行了研究,主要包括三个方面:数据库音乐的旋律特征提取、哼唱音乐的旋律特征提取和旋律检索匹配方法。基于此,设计并实现一个基于哼唱的音乐检索系统。主要研究内容有:1.分析对比了常见的音乐文件格式,选择了MIDI格式作为乐曲库音乐文件格式。分析了MIDI文件的结构,然后提出了确定主音轨的方法,并从中提取出音乐文件的旋律轮廓。2.研究了几种基音提取算法,为了系统在速度和精度上都有较好的表现,本文在基音提取这一步选择简化逆滤波法。在提取出基音曲线之后,滤除无声段信号,提高系统可靠性。最后对基音曲线音符切分,从而提取出音高和音长,生成了哼唱信号的旋律特征。3.在旋律匹配部分,分析了几种匹配检索算法的优缺点,结合本系统对准确率和速度的要求,最终确定了分层检索的结构。首先用基于句子长度的N-Gram索引来粗匹配,过滤掉大部分不可能是结果的歌曲;然后使用DTW实现精细匹配。本文在完成上述工作后,对系统进行了实验,并与其他论文进行了对比,结果表明该系统有一定的实用性。

全文目录


摘要  3-4
ABSTRACT  4-7
1 绪论  7-13
  1.1 背景和意义  7
  1.2 研究现状  7-12
    1.2.1 音乐数据库建设的现状  8-9
    1.2.2 哼唱特征提取技术的发展  9-10
    1.2.3 音乐旋律表示方法的发展  10-11
    1.2.4 旋律匹配的现状  11-12
  1.3 论文主要工作  12-13
2 数据库音乐文件的旋律提取  13-23
  2.1 音符及主旋律  14
  2.2 数据库音乐的文件格式  14-17
  2.3 MIDI 文件格式的分析  17-18
  2.4 MIDI 旋律特征提取  18-20
    2.4.1 确定主旋律  18-19
    2.4.2 提取乐曲旋律特征  19-20
    2.4.3 特征文件生成  20
  2.5 本章小结  20-23
3 哼唱旋律特征的提取  23-37
  3.1 哼唱信号预处理  23-26
  3.2 提取音乐信号的基音  26-32
  3.3 基音检测后的处理  32-34
    3.3.1 能量检测  32
    3.3.2 过零率检测  32-33
    3.3.3 中值平滑过滤  33-34
  3.4 音符的切分  34-35
  3.5 特征参数的计算  35
  3.6 本章小结  35-37
4 检索匹配方法  37-49
  4.1 旋律匹配的方法  37-43
    4.1.1 近似字符串匹配法  37-39
    4.1.2 动态时间规整法  39-42
    4.1.3 隐马尔可夫算法  42-43
    4.1.4 线性对齐匹配法  43
  4.2 基于N-Gram 的DTW 检索匹配算法  43-47
    4.2.1 建立N-gram索引模型  45-46
    4.2.2 粗匹配过程  46
    4.2.3 精细匹配过程  46-47
  4.3 本章小结  47-49
5 实验与分析  49-55
  5.1 哼唱检索系统架构  49-50
  5.2 系统实验结果分析  50-53
    5.2.1 实验前的考虑  50-51
    5.2.2 实验环境  51
    5.2.3 实验结果和分析  51-52
    5.2.4 实验结果对比  52-53
  5.3 本章小结  53-55
6 结论与展望  55-57
致谢  57-59
参考文献  59-63
作者在读期间的研究成果  63

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 基于DSP的机器人语音命令识别系统研制,TN912.34
  3. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  4. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  5. Q学习在基于内容图像检索技术中的应用,TP391.41
  6. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  7. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  8. 空间交会接近视觉测量方法研究,TP391.41
  9. 图像实时采集、存储与处理方法研究,TP391.41
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 多币种纸币处理技术的研究与实现,TP391.41
  12. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  13. 基于图像的路面破损识别,TP391.41
  14. 移动机器人视觉检测和跟踪研究,TP242.62
  15. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  16. 基于随机森林的植物抗性基因识别方法研究,Q943
  17. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  18. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  19. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  20. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  21. 基于小波变换的三维模型特征提取技术的研究与实现,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com