学位论文 > 优秀研究生学位论文题录展示

说话人识别相关技术的研究

作 者: 刘渭清
导 师: 彭进业
学 校: 西北大学
专 业: 电路与系统
关键词: 说话人识别 特征提取 矢量量化 小波分析 语音增强
分类号: TN912.3
类 型: 硕士论文
年 份: 2005年
下 载: 250次
引 用: 2次
阅 读: 论文下载
 

内容摘要


说话人识别是语音信号处理的一项重要技术,是当前研究的热点之一。本文在整理、归纳、总结前人工作的基础上,着重介绍了矢量量化技术和小波分析理论在说话人识别中的应用并作了如下几方面的工作: 1.在Windows 2000环境下,利用VC++6.0编译系统开发了实时语音数据采集系统,建立了语音数据库,为后续研究和测试做准备。 2.研究了矢量量化理论在说话人识别中的应用,对基于倒谱系数的方差加权算法进行了分析和实验验证,结果表明该方法是有效的。 3.阐述了小波分析理论应用于语音增强的原理,并将基于自适应阈值小波去噪算法应用于说话人识别系统的预处理。实验结果表明,这种方法具有语音增强效果,应用于噪声环境下的说话人识别系统时,能够提高系统的鲁棒性。

全文目录


摘要  4-5
Abstract  5-6
目录  6-9
第1章 绪论  9-18
  1.1 引言  9-10
  1.2 说话人识别的基本原理与结构  10-12
    1.2.1 说话人识别基本原理  10-11
    1.2.2 说话人识别系统结构  11-12
  1.3 说话人识别的应用领域  12-14
  1.4 说话人识别技术的发展状况  14-15
  1.5 说话人识别的技术难点  15-16
  1.6 研究的任务  16-18
    1.6.1 语音信号数据平台的建立  16
    1.6.2 基于方差加权矢量量化算法的应用研究  16-17
    1.6.3 小波语音增强在说话人识别中的应用  17-18
第2章 语音信号的一般分析方法  18-32
  2.1 语音信号的时域处理方法  18-20
  2.2 语音信号的端点检测  20-23
    2.2.1 短时能量和短时平均过零率  20-22
    2.2.2 双门限前端检测算法  22-23
  2.3 基音周期  23-24
  2.4 倒谱系数  24-27
    2.4.1 倒谱定义  25
    2.4.2 倒谱特征  25-27
  2.5 语音信号小波分析时频原理  27-31
    2.5.1 短时付利叶变换  28-29
    2.5.2 Grossmann-Morlet小波变换  29-31
  2.6 小结  31-32
第3章 Windows环境下的语音录入平台的建立  32-41
  3.1 音频程序编写的主要步骤  32-33
    3.1.1 打开/关闭音频设备驱动程序  32
    3.1.2 分配/准备音频数据缓冲区  32-33
  3.2 相关结构和函数的说明  33
  3.3 程序编写简介及部分程序代码  33-40
  3.4 本章小节  40-41
第4章 矢量量化算法在说话人识别中的应用  41-56
  4.1 矢量量化的基本原理  41-42
  4.2 矢量量化的一般方法  42-43
  4.3 矢量量化的失真测度  43-44
  4.4 最佳矢量量化器和码本的设计  44-47
    4.4.1 LBG算法  45-46
    4.4.2 初始码书生成  46-47
  4.5 基于方差加权矢量量化算法的说话人识别原理  47-51
    4.5.1 说话人特征参数  48
    4.5.2 方差加权矢量量化的建模分析  48-51
  4.6 方差加权的VQ说话人识别实验  51-55
  4.7 本章小节  55-56
第5章 小波语音增强在说话人识别中的应用  56-71
  5.1 小波语音增强方法的原理  57-63
    5.1.1 小波变换与信号的奇异性  57-58
    5.1.2 语音信号与噪声的小波变换特性  58-59
    5.1.3 带噪语音信号的小波变换增强算法  59-63
  5.2 实验结果与分析  63-70
    5.2.1 实验所采用的语音数据  63-64
    5.2.2 语音增强效果实验  64-69
    5.2.3 应用于说话人识别系统的实验  69-70
  5.3 本章小结  70-71
第六章 研究总结与展望  71-72
  6.1 工作总结  71
  6.2 展望  71-72
致谢  72-73
参考文献  73-78
硕士学位期间撰写的相关学术论文  78

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 航天继电器时间参数测试分析技术的研究,TM58
  3. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  6. Q学习在基于内容图像检索技术中的应用,TP391.41
  7. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  8. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  9. 空间交会接近视觉测量方法研究,TP391.41
  10. 图像实时采集、存储与处理方法研究,TP391.41
  11. 唇读中的特征提取、选择与融合,TP391.41
  12. 多币种纸币处理技术的研究与实现,TP391.41
  13. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  14. 基于图像的路面破损识别,TP391.41
  15. 移动机器人视觉检测和跟踪研究,TP242.62
  16. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  17. 基于汉语听觉认知的事件相关电位的研究,R318.0
  18. 基于随机森林的植物抗性基因识别方法研究,Q943
  19. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  20. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  21. 羊绒与羊毛纤维鉴别系统的研究,TS101.921

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com