学位论文 > 优秀研究生学位论文题录展示
基于哼唱的音乐检索技术研究与实现
作 者: 鲁佳
导 师: 张明
学 校: 上海海事大学
专 业: 计算机软件与理论
关键词: 基于内容的音乐检索 哼唱检索 特征提取 基频 音频分割
分类号: TP391.3
类 型: 硕士论文
年 份: 2007年
下 载: 234次
引 用: 2次
阅 读: 论文下载
内容摘要
随着多媒体技术和网络的迅速发展,数字化的视频、音频信息已取代模拟视频、音频信息遍及INTERNET,如何从海量的数字信息中检索出我们需要的内容,是当前研究的热点问题之一。传统的音乐信息检索方法是基于曲名、作者、演奏者等等这样的属性。但这种方式并不是最理想的检索方式。这些信息本质上讲不是音乐内容本身,而是音乐的附属特征。一般情况下人们通过音乐的旋律特征来记忆音乐,所以很自然的想到利用哼唱歌曲旋律的方式来进行音乐的查找。基于内容的音乐检索技术是近年来的研究热点之一,它试图通过提取音频流中音高、音长等特征来表达和识别音乐的内容,并按照相似度量的方法检索音乐。其中最主要的两个问题是音乐特征提取和旋律的检索匹配。本文以音乐检索为背景,主要对哼唱容易发生的错误,音高的提取和检索算法进行了研究,在此基础上设计了一种音高提取方法,并从降低哼唱错误和特征提取不精确对检索的影响出发,提出了一种峰值对齐匹配算法。主要工作如下;(1)研究与检索相关的音乐知识。对声音的四要素,乐曲的定调规则,半音与声音频率的对应关系等进行了深入的研究,在此基础上总结了哼唱的音调与标准音调之间的差异。这些工作确定了提取何种特征,特征的量化,以及如何降低哼唱错误对检索的影响。(2)研究数字信号处理在特征提取中的应用。对时域分析和频域分析作了细致的分析和研究。由于歌曲声中混杂着人声、各种乐器声、掌声以及环境噪声等问题,因此设计了一种复杂声音环境下的主旋律音高提取算法。在音长提取方面,本文设计了一种不限定哼唱方式的音符分割方法,该方法也适用于从一般歌曲中提取的音高特征序列。因为两种算法的设计,使得本文所设计的原型系统中音乐库可以使用wav等格式的音乐,而非多数人使用的midi格式。(3)提出了峰值对齐匹配法。此算法与(U,D,R)算法,N-gram算法等字符串模糊匹配算法以及基于HMM的检索算法等统计模型的算法相比较属于轮廓比较算法。该算法可以较容易的降低哼唱中多种错误对检索过程的影响。算法速度优于以(U,D,R)算法为代表的部分字符串模糊匹配算法,也快于基于HMM模型的统计检索算法。实验结果表明,该算法是有效的,查询者绝大多数情况下能在查询结果的前几位找到查询的目标音乐。通过上述工作,证明了本文中算法的有效性,并建立了原型系统,实现了基于‘哼唱’的音乐检索。在基于内容的音乐检索方面进行了有益的探索和研究。
|
全文目录
摘要 3-5 ABSTRACT 5-9 第一章 绪论 9-13 1.1 研究问题的提出 9-10 1.2 国内外研究现状 10-11 1.3 本文研究的主要问题及安排 11-13 第二章 基于内容的音乐检索系统 13-19 2.1 音乐检索概述 13-15 2.2 音乐特征处理过程 15-17 2.2.1 音乐类音频文件的特征分析 15-16 2.2.2 特征处理 16-17 2.3 基于哼唱的音频检索系统结构 17-18 2.4 本章小结 18-19 第三章 音乐检索中的相关音乐知识 19-24 3.1 音乐概述 19 3.2 声音的四个要素与音乐 19-23 3.2.1 音强 19-20 3.2.2 音高 20-22 3.2.3 音色 22 3.2.4 波形包络 22-23 3.3 本章小结 23-24 第四章 信号处理与特征提取 24-41 4.1 声音信号处理 24-32 4.1.1 时域分析法 24-28 4.1.2 语音的频域分析法 28-32 4.2 旋律特征提取的实现 32-40 4.2.1 音高提取 32-39 4.2.2 音长提取 39-40 4.3 本章小结 40-41 第五章 匹配算法 41-65 5.1 音频检索技术的研究 41-52 5.1.1 经典(U,D,R)算法的介绍与分析 41-44 5.1.2 轮廓匹配算法的介绍与分析 44-46 5.1.3 统计模型算法——基于HMM的算法的介绍与分析 46-52 5.2 峰值对齐匹配算法的设计与实现 52-58 5.3 峰值对齐匹配算法与前述匹配算法的比较 58-62 5.4 峰值对齐匹配算法的实验与分析 62-64 5.5 本章小结 64-65 第六章 总结与展望 65-67 6.1 完成的主要工作 65 6.2 进一步研究工作 65-67 参考文献 67-71 致谢 71
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 红外图像目标识别及跟踪技术研究,TP391.41
- 水下目标特征的压缩与融合技术研究,TN911.7
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|