学位论文 > 优秀研究生学位论文题录展示
音乐结构自动分析研究
作 者: 石自强
导 师: 李海峰
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 流行音乐结构分析 人声发现 支持向量机 直线发现 拉东变换
分类号: TN912.3
类 型: 硕士论文
年 份: 2008年
下 载: 81次
引 用: 0次
阅 读: 论文下载
内容摘要
音乐是目前音频处理领域重要的研究对象之一,其是多种可感知信息的良好载体。而音乐结构是音乐组织表达信息的一种表现手段,对它的分析是理解音乐的重要途径之一,是目前音乐检索技术的热点之一。本文从两个角度将流行音乐的结构分为前奏(intro)、主歌(verse)、副歌(chorus)、过门音乐(bridge)和结尾(outro)五部分。一个角度是流行音乐中人声的识别;另一角度是基于相似性矩阵的流行音乐结构分析。由于除了主歌、副歌,其他部分基本都是纯音乐组成,因此流行音乐中人声的识别对于流行音乐的结构分析有着很大的辅助作用。对于此问题,我们使用SVM分类器针对MFCC特征进行训练和分类,基于音频连续性的考虑,后期对于分类结果低通滤波,使识别率平均提高11.9%。实验结果表明,在帧的基础上识别率可以达到85.76%。相似性矩阵将处理一维的音频问题转化为处理二维图像的问题,其中由于主歌和副歌在音乐中会重复出现,所以两者在相似性矩阵图像中呈现为一些水平直线,这样将问题转化为图像中直线的发现问题。这里我们把这样一个灰度图像内的直线发现问题从反问题的角度来考虑。这里的反问题是建立在拉东变换的基础上。这样做的优点是我们可以从一个正规化的框架内来解决这个问题,而正规化可以比较自然的结合先验知识,从而提高基于拉东变换的直线检测方法的性能。这样,我们通过流行音乐中人声的识别确定了intro、bridge和outro的位置,通过基于相似性矩阵的流行音乐的结构分析确定了verse和chorus的位置。最后综合两方面的结果,完成流行音乐的结构分析工作。流行音乐中的副歌(高潮)检出(chorus detection)是MIR领域中一个重要的问题,本文给出的流行音乐的结构分析不仅给出了音乐中副歌的位置,同时给出音乐中其他具有代表性的乐段的位置。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-13 1.1 课题背景 9 1.2 国内外研究现状 9-11 1.3 歌曲结构分析框架 11-12 1.4 本文的研究内容 12-13 第2章 基本音乐理论和歌曲结构 13-23 2.1 基本音乐理论 13-16 2.1.1 音高和时长 13-14 2.1.2 调式与调性 14-15 2.1.3 旋律 15-16 2.2 歌曲结构理论 16-19 2.2.1 流行歌曲背景知识 16-18 2.2.2 流行歌曲的结构 18-19 2.3 歌曲结构信息的图形化表示 19-22 2.3.1 特征选取 19-20 2.3.2 相似性矩阵 20-22 2.4 本章小结 22-23 第3章 流行音乐中人声的识别 23-36 3.1 引言 23 3.2 基于SVM 的人声的识别 23-32 3.2.1 支持向量机简介 23-30 3.2.2 人声识别 30-32 3.3 音频数据库及系统整体框架 32-33 3.3.1 音频数据库 32 3.3.2 系统整体框架 32-33 3.4 实验结果及分析 33-35 3.5 本章小结 35-36 第4章 相似性矩阵中直线检测研究 36-49 4.1 直线检测算法 37-43 4.1.1 问题的形式化 37-38 4.1.2 正规化子的选择 38-40 4.1.3 正规化问题的算法 40-41 4.1.4 前面某些论断的证明 41-43 4.2 实验 43-47 4.3 本章小结 47-49 结论 49-50 参考文献 50-55 攻读学位期间发表的学术论文 55-57 致谢 57-58 简历 58
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|