学位论文 > 优秀研究生学位论文题录展示
基于熵的音乐声纹检索算法的研究与实现
作 者: 周传平
导 师: 邵曦
学 校: 南京邮电大学
专 业: 信号与信息处理
关键词: 熵 非参数估计 Parzen窗函数 索引 相似匹配
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 6次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络多媒体技术的发展,数字音乐内容越来越丰富,如何不局限于文字检索,而采用基于内容的音乐检索方式从音乐库中找到所需的歌曲已成为一个研究热点。基于熵的音乐检索算法采用录音片段的形式,可以快速、准确的从音乐库中找到对应的歌曲信息,利用它可以对未知歌曲信息的音乐进行检索,这对于以后音乐的管理和版权保护等领域都具有重要的影响。本文对音乐检索涉及的基本概念和背景进行了介绍,重点研究了音乐的声纹提取和检索算法,并基于此设计实现了一系列对比实验。本文主要的研究工作包括以下几个方面:(1)对基于熵的音乐检索相关的理论知识进行了研究与分析,给出了检索系统的总体框架和综述。(2)针对音乐特征的概率分布无法已知的问题,给出了基于熵的非参数估计的声纹提取算法。在常见的失真和噪声环境下,通过与参数方法进行对比实验,显示出非参数方法可以更精确的描述音乐的概率分布,声纹鲁棒性更强。(3)在对常用的音乐检索方法进行研究和对比的基础上,提出了一种改进的基于索引的匹配检索算法。通过匹配实验可以看出,成功检索到目标歌曲的概率较大,且效率较高。(4)利用本文研究的声纹提取和检索算法,设计并实现了一个音乐仿真系统。结合使用经过软件处理和实际情况下的检索片段,取得了较好的检索效果。
|
全文目录
摘要 4-5 Abstract 5-6 目录 6-8 缩略语 8-9 第一章 绪论 9-14 1.1 研究背景及意义 9-10 1.2 国内外研究现状 10-12 1.3 论文的主要研究工作及内容安排 12-14 第二章 音乐声纹检索系统综述 14-25 2.1 音频声纹系统总体框架 14-15 2.2 声纹提取算法综述 15-20 2.2.1 基本乐理 15 2.2.2 声纹特征的提取 15-17 2.2.3 声纹的提取步骤 17-20 2.3 声纹检索算法综述 20-23 2.4 声纹系统的评价标准 23-24 2.5 本章小结 24-25 第三章 基于熵的非参数估计的声纹提取算法 25-43 3.1 非参数方法基本理论 25-28 3.2 非参数方法估计PDF 28-31 3.3 声纹提取 31-36 3.3.1 熵的计算 31-33 3.3.2 声纹提取步骤 33-36 3.4 声纹鲁棒性实验 36-42 3.4.1 误比特率分析 37-39 3.4.2 匹配识别率分析 39-42 3.5 本章小结 42-43 第四章 声纹检索算法 43-57 4.1 常用的检索算法 43-45 4.1.1 基于树结构的索引方法 43-44 4.1.2 近似字符串匹配算法 44-45 4.1.3 基于哈希表的索引方法 45 4.2 基于索引的音乐声纹匹配检索算法 45-56 4.2.1 声纹数据库建立过程 46-48 4.2.2 声纹初步检索过程 48-51 4.2.3 阈值的选取 51-53 4.2.4 声纹详细匹配过程 53-56 4.3 本章小结 56-57 第五章 音频检索实验 57-66 5.1 实验系统框架 57 5.2 歌曲数量对于检索性能的影响 57-59 5.3 系统检索识别率实验 59-62 5.4 算法对比分析 62-64 5.5 误判率与漏报率分析 64-65 5.6 仿真系统性能分析 65 5.7 本章小结 65-66 第六章 总结与展望 66-68 本文工作总结 66 未来工作展望 66-68 致谢 68-69 参考文献 69-74 攻读硕士学位期间撰写的学术论文 74
|
相似论文
- 偏振条件下辐射能和熵传输的数值模拟,TK124
- 流动与混合过程中不可逆损失的研究,TK12
- 基于信息熵的课堂观察量化评价模型研究,G632.4
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 大规模稀疏关系数据索引技术研究,TP311.132.3
- 面向动态文档集的大规模文本索引构建技术的研究,TP391.3
- 领域实体属性及事件抽取技术研究,TP391.1
- 图像分割中阴影去除算法的研究,TP391.41
- 基于停用词处理的汉语语音检索方法,TP391.1
- 面向海量邮件的检索系统研究与实现,TP393.098
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 公路生态系统健康评价方法研究,X826
- Bicluster数据分析软件设计与实现,TP311.52
- 网络搜索引擎的相关技术研究,G354
- D.R.斯汀森《密码学》中一些传统编码与破译方法的改进,TN918.1
- 肥城煤炭配送中心配煤模型研究,F259.2;F224
- 汉语框架自动识别中的歧义消解,TP391.1
- 苏州三值仪器有限公司的营销模式研究,F426.4
- 熵在经济预测模型评价中的应用,F201
- 虹膜识别算法的研究与实现,TP391.41
- 基于SMP的内存数据库查询处理优化研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|