学位论文 > 优秀研究生学位论文题录展示

音乐信号节奏信息实时获取技术研究与系统实现

作 者: 孙健
导 师: 孙怡
学 校: 大连理工大学
专 业: 电子与通信工程
关键词: 音乐音频信号 节奏 节拍点 Viterbi算法 动态规划
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 10次
引 用: 0次
阅 读: 论文下载
 

内容摘要


音乐是人类最伟大的艺术之一,它深远地影响人类的精神生活。近年来,由于数字音频处理技术及多媒体技术快速发展,数字音乐已经深入到人们生活的方方面面,不断影响着人类欣赏音乐的方式,人们对音乐欣赏的需求不断增长。与此同时,数字音乐信息获取技术得以快速发展,国内外很多科研工作者和研究机构对数字音乐特征获取和音乐内容理解进行了深入的研究。为促使音乐信息获取技术的发展及其相关技术的应用,本文对基于数字音频信号的音乐节奏信息获取技术进行了广泛的调研与深入的研究,设计了一种实时解析音乐节拍点,跟踪音乐速度与拍子结构等节奏信息变化的系统,目的在于使计算机也能够和人样“听懂”音乐的韵律节奏。在设计节奏信息获取系统的过程中,本文首先对原始音频信号进行特殊的简化处理,以得到音乐事件起始点检测函数,继而以此函数序列作为节奏获取模型的输入,利用基于无偏的自相关函数与梳状抽样函数模板的方法估计音乐节拍点周期与节拍点相位,并跟踪音乐速度的变化与识别拍子结构信息。但这种实时预测模型对音乐速度的变化比较敏感,预测的节拍点位置往往不够准确,导致模型可靠性降低。为提高音乐节奏实时预测模型的可靠性与准确性,本文利用基于隐马尔科夫模型的Viterbi解码算法与动态规划的方法对历史音频数据进行分析,求解出最佳的音乐节拍点位置序列,并以此对实时预测模型进行改进。最后本文利用已进行准确值标注的音乐音频片段对系统进行了实验与评估。实验和评估的结果表明改进后的模型达到了提高预测准确性的预期目的。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-12
  1.1 课题研究背景及意义  8-9
  1.2 音乐信息获取技术的发展概况  9-11
  1.3 本论文主要工作内容安排  11-12
2 基本乐理与音频信号处理技术简介  12-19
  2.1 基本乐理  12-14
    2.1.1 基本概念  12-13
    2.1.2 音乐节奏概念剖析  13-14
  2.2 音频信号的时域处理  14-16
    2.2.1 短时能量和短时平均幅度  14-15
    2.2.2 短时平均过零率  15
    2.2.3 短时自相关函数  15-16
    2.2.4 短时平均幅度差函数  16
  2.3 音频信号的短时傅里叶变换分析  16-19
3 音乐节奏实时获取系统设计与实现  19-35
  3.1 系统概述  19-20
  3.2 起始点检测函数的获取  20-26
    3.2.1 起始点检测函数的意义  20-22
    3.2.2 复数域频谱差算法生成起始点检测序列  22-26
  3.3 实时节奏预测模型  26-35
    3.3.1 节拍点周期估计  27-32
    3.3.2 节拍点相位估计  32-34
    3.3.3 速度与拍子结构的估计  34-35
4 系统的改进与评估  35-54
  4.1 离线节拍点检测算法  35-44
    4.1.1 动态规划算法简介  35-36
    4.1.2 隐马尔科夫模型HMM  36-39
    4.1.3 Viterbi解码算法  39-44
  4.2 基于隐马尔科夫模型的Viterbi算法改进实时预测模型  44-51
    4.2.1 解码节拍点周期序列  45-46
    4.2.2 运用动态规划方法求解最优节拍点位置序列  46-49
    4.2.3 对实时预测模型进行改进  49-51
  4.3 评估方法与结果讨论  51-54
结论与展望  54-55
参考文献  55-58
攻读硕士学位期间发表学术论文情况  58-59
致谢  59-60

相似论文

  1. 高职学前教育专业节奏训练研究,J613.1
  2. 现代音乐“节奏形态”对于“节奏视唱”训练的现实意义,J605
  3. 基于参考图像的乳腺肿块诊断方法研究,TP391.41
  4. 电力系统电压无功控制方法研究,TM761.1
  5. 主观题自动评分技术研究,TP391.1
  6. 水库多目标优化调度研究,TV697.1
  7. 面向情感的电影背景音乐分类方法研究,TP391.1
  8. 基于动态规划的房地产多项目开发优化决策,F293.3
  9. 基于MRPⅡ、JIT、TOC的在制品管理系统理论研究及设计开发,TP311.52
  10. “八板”元素在当代音乐作品中的应用,J614.5
  11. 软件企业人力资源调度方法研究与实现,TP311.52
  12. 面向DAG数据依赖型应用系统研究与实现,TP311.1
  13. 不相容工件族的平行批序的一些结果,O223
  14. 输电线路建设项目成本管理研究,F426.61
  15. 客运专线综合维修计划编制系统的研究,U29-39
  16. 视觉设计的乐感研究,J524
  17. 爱·摩·福斯特小说《看得见风景的房间》中的象征主义和节奏解读,I561.074
  18. 女子排球中控制节奏能力培养的实验研究,G842
  19. 虚拟企业的收益分配研究,F270.7
  20. 缴费确定型企业年金最优投资战略研究,F842.6;F272

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com