学位论文 > 优秀研究生学位论文题录展示

基于内容的相关反馈式音乐检索方法研究

作 者: 陈刚
导 师: 王天江
学 校: 华中科技大学
专 业: 计算机应用技术
关键词: 基于内容的音乐检索 相关反馈 支持向量机 主动学习 音乐理论
分类号: TN912.3
类 型: 博士论文
年 份: 2010年
下 载: 298次
引 用: 3次
阅 读: 论文下载
 

内容摘要


数字音乐是一种重要的多媒体数据形式,随着互联网和音频处理技术的发展,海量的音乐被创作出来并迅速的在消费者中进行传播。在浩如烟海的音乐库中如何快速、有效的寻找到所需要的音乐是一项非常有意义的课题。目前商业搜索引擎如谷歌、百度等依靠音乐相关联的文字信息完成检索任务,面临着文字信息的获得费时、费力、片面等问题。近年来,基于内容的音乐检索获得了广泛的关注,然而由于“语义鸿沟”的存在,检索的性能往往不尽如人意。将相关反馈技术引入到基于内容音乐检索中,可以弥补音乐底层特征和高层语义信息之间的差距,提高检索性能。在音乐内容的表达方面,首先,就音乐特征的提取方法进行了有益的探讨。所涉及的音乐特征,不仅仅包括语音信号处理领域常用的时频特征,还包括音乐信号特有的音色、节拍等特征。对于音乐的节拍特征,提出了一种基于常数Q变换特征的音乐节拍特征提取算法,并将其与自动规划算法有效结合,从而实现了基于音乐节拍的自动标注,为后续研究工作的开展打下了基础。在音乐特征提取的基础上,着重开展了基于支持向量机相关反馈式音乐检索方面的研究。首先采用单类支持向量机相关反馈的方法进行音乐检索,针对单类支持向量机不能处理负相关反馈样本的问题,提出了一种将正负相关样本同时引入单类支持向量机相关反馈的思路,并以此实现了基于单类支持向量机的相关反馈方法。对于两类支持向量机的相关反馈,进一步展开了针对多样本相关反馈式音乐检索的研究,提出了一种多抽样样本反馈的方法。提出了距离复杂度的概念,对于所选择的抽样样本,不仅仅要求能最大化减小支持向量机版本空间面积,还要求在映射空间中最小距离最大,且来自于高密度区域,用以消除样本间的冗余度和避免孤异点的选取。音乐检索实验表明,所提出的算法取得了比现有文献中提出的反馈算法更好的实验结果。在基于内容的音乐标注方面,国内外现有文献主要是采用两类分类方法,结果得到多个分类器,造成用户标注资源利用率不高。提出了一种基于多类支持向量机的音乐标注算法,不但能够解决多类分类问题,而且通过主动学习的技术,能在用户标注较少的音乐样本的情况下,获得较好的标注效果,从而更具实用性。

全文目录


摘要  4-6
Abstract  6-10
1 绪论  10-24
  1.1 引言  10-11
  1.2 课题背景与研究意义  11-12
  1.3 国内外研究现状与分析  12-21
  1.4 论文主要研究工作  21-24
2 基于内容的音乐特征提取  24-44
  2.1 音乐信号的预处理  24-25
  2.2 声学特征提取  25-29
  2.3 音调特征提取  29-35
  2.4 节拍特征提取  35-40
  2.5 调式与调性  40-43
  2.6 本章小结  43-44
3 基于单类支持向量机的反馈式音乐检索  44-59
  3.1 引言  44-45
  3.2 基于单类支持向量机的相关反馈  45-48
  3.3 结合正负反馈样本的单类支持向量机相关反馈方法  48-53
  3.4 实验与结果分析  53-58
  3.5 本章小结  58-59
4 基于主动学习的支持向量机音乐检索  59-78
  4.1 引言  59-60
  4.2 支持向量机基本原理  60-64
  4.3 基于支持向量机的主动学习  64-70
  4.4 多样本选择策略  70-72
  4.5 实验与结果分析  72-77
  4.6 本章小结  77-78
5 音乐的自动标注技术  78-95
  5.1 引言  78-80
  5.2 基于多类支持向量机的主动学习  80-84
  5.3 多抽样多类支持向量机的主动学习策略  84-87
  5.4 歌曲有歌唱部分检测  87
  5.5 实验与结果分析  87-94
  5.6 本章小结  94-95
6 全文总结与展望  95-98
  6.1 论文总结  95-96
  6.2 进一步研究工作  96-98
致谢  98-99
参考文献  99-112
附录1 攻读学位期间发表的论文目录  112

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. Q学习在基于内容图像检索技术中的应用,TP391.41
  9. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  10. 生物医学领域检索系统查询扩展技术研究,TP391.3
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 基于支持向量机的故障诊断方法研究,TP18
  14. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  15. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  16. 基于车载3D加速传感器的路况监测研究,TP274
  17. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  18. 基于机器学习的入侵检测系统研究,TP393.08
  19. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  20. 基于AdaBoost算法的人脸识别研究,TP391.41
  21. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com