学位论文 > 优秀研究生学位论文题录展示
VQ与HMM联合模型语音信号的实验研究
作 者: 李国峰
导 师: 吴胜举
学 校: 陕西师范大学
专 业: 声学
关键词: 语音信号识别 隐马尔可夫模型(HMM) 矢量化模型(VQ) 美尔(Mel)参数
分类号: TN912.3
类 型: 硕士论文
年 份: 2010年
下 载: 55次
引 用: 0次
阅 读: 论文下载
内容摘要
人类一直都在梦想着能够通过语言直接指挥机器做出相应的各种动作,以便于完成特殊环境下的工作。但是,在很长的时间里,这个梦想没有能够实现。直到信息化时代的今天,计算机科学及其相关学科的高速发展为人类的这个梦想提供了高效的实现手段,使机器理解人的语言成为可能,这种使机器理解语言的技术就是语音信号分析识别技术。近二十年来,人类社会的高速发展对语音信号分析识别技术提出了越来越高的要求,同时科学技术的进步也为语音信号分析识别技术提供了各个方面的理论与技术支持,使语音信号分析识别技术取得显着进步,开始从实验室走向市场。在不久的将来,语音信号分析识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等人类生产生活的各个领域。本文在语音信号分析识别的基本原理和基本技术的基础上,通过对马尔可模型(HMM)和矢量量化模型(VQ)的研究和分析,针对HMM模型虽然建模能力很强,但是识别能力受到环境影响很大,而矢量量化模型建模能力虽然不强,但由于矢量的相似性使得它的识别能力很好的特点;在分析了两者的优缺点基础上,提出了新的模型和算法。同时,依据实验条件,选择Mel参数作为识别特征参数。在新的模型下,建立了语音分析识别系统,对所选取的语音信号进行特征参数提取和语音信号分析识别。在相同条件下,对同一语音信号的分析识别结果与HMM模型的分析识别结果进行了对比,研究结果表明:联合模型的识别结果普遍高于单一HMM模型,联合模型的性能要优于HMM模型;并进一步应用建立的联合模型在指定样本、指定语音信号、不指定样本不指定语义信号这三种情况下,做了联合模型的稳定性实验,得出了联合模型的性能比较可靠、运算比较良好。
|
全文目录
摘要 3-4 Abstract 4-7 第1章 绪论 7-11 1.1 语音分析识别的国内外发展简史 7-9 1.2 语音识别的现实意义 9 1.3 语音信号分析识别面临的困难 9-10 1.4 本文主要研究内容 10-11 第2章 语音信号分析识别基本技术概述 11-15 2.1 语音分析识别分类及其基本技术过程概述 11-12 2.2 语音信号的起始点与截止点确定 12-13 2.2.1 短暂时间内的语音信号能量变化E_n 12-13 2.2.2 短暂时间内的语音信号过零点的平均次数 13 2.3 本章小结 13-15 第3章 实验模型的建立 15-21 3.1 主流识别模型的基本情况简介 15-17 3.1.1 隐马尔科夫模型 15-16 3.1.2 矢量量化模型 16-17 3.2 主流识别模型各自的优点与不足 17-18 3.2.1 隐马尔科夫模型的优点与不足 17-18 3.2.2 矢量量化模型的优点与不足 18 3.3 联合模型的提出 18-19 3.4 本章小结 19-21 第4章 算法及实验设计 21-31 4.1 算法的设计构想 21-22 4.2 实验设备简介 22-23 4.3 实验数据的采集与处理 23-25 4.4 特征参数的作用与选择 25-30 4.4.1 线性预测编码(LPC)系数 26 4.4.2 美尔频标倒谱系数Mel 26-30 4.5 本章小结 30-31 第5章 实验数据分析 31-47 5.1 算法及联合模型有效性的实验验证 31-37 5.2 算法及联合模型的稳定性实验验证 37-46 5.2.1 同一个样本不同语音内容的实验验证 37-41 5.2.2 不同样本相同语音信号的实验验证 41-44 5.2.3 不指定样本及语音内容的实验验证 44-46 5.3 本章小结 46-47 第6章 总结与展望 47-51 6.1 工作总结 47-48 6.2 工作展望 48-51 参考文献 51-55 致谢 55-57 硕士研究生期间所发表的文章 57
|
相似论文
- SVM和HMM混合模型的研究及其应用,TP391.41
- 基于DSP的声控系统的研究与实现,TP273
- 基于HMM模型的启动子预测系统的设计与实现,Q78
- 基于HMM与AIS混合模型的核动力设备故障诊断系统开发,TP277
- 基于HMM和微粒群优化算法的核电设备机械故障诊断技术的研究,TH165.3
- 语音识别算法及其在嵌入式中的应用,TN912.34
- 遗传连锁群中分子标记排序研究,TP18
- 面向智能视频监控的事件检测建模及优化,TP391.41
- 面向机器人对话的语音识别关键技术的研究,TN912.34
- 基于HMM的多特征融合钻头磨损监测技术的研究,TG713
- 基于图像重构和特征融合的人脸识别方法研究,TP391.41
- 基于力学量信息获取系统的人体摔倒过程识别方法研究,TP391.4
- 离线阿拉伯手写体光学文字识别方法的研究,TP391.43
- 音乐音符识别的方法,TN912.34
- 基于多特征集成和分级分类的图像序列表情识别方法研究,TP391.41
- 基于HMM的人脸识别研究,TP391.41
- 基于隐马尔可夫模型的并行多重序列比对,TP301
- 基于程序行为的异常检测技术研究与实现,TP311.1
- 基于人工免疫原理的网络入侵检测研究,TP393.08
- 变换域中基于广义伽玛分布的软语音活动检测算法研究,TN912.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|