学位论文 > 优秀研究生学位论文题录展示

基于文本无关的说话人识别研究

作 者: 刘俊波
导 师: 徐文尚
学 校: 山东科技大学
专 业: 控制理论与控制工程
关键词: 特征提取 说话人识别 矢量量化 LPC倒谱系数
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 11次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数,自动鉴别说话人身份的技术。说话人识别技术以其独特的方便性、经济性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。本文的研究对象是与文本无关的说话人识别系统。首先,详细讨论了说话人识别系统的基本原理,接着介绍了语音信号产生的数学模型、语音信号的数字化及预处理,内容涉及语音信号的加窗、分帧、预加重滤波、端点检测;重点讨论了传统的双门限端点检测算法,并给出了传统双门限端点检测算法的程序。针对传统双门限端点检测算法适应性不强的特点,提出了一种改进的端点检测方法:能频值端点检测算法;重点分析了当前最常用的三种语音特征参数:线形预测系数、线形预测倒谱系数和基于听觉特性Mel频率倒谱系数。并提取了这三种系数。其次,着重讨论了说话人识别常用的方法:基于矢量量化的说话人识别方法。详细讨论了VQ的基本原理、失真测度、最佳码本设计以及介绍了基于FVQ的说话人识别方法,实验结果表明基于FVQ的识别率较基于VQ的识别率要好。再次,编写了以△MFCC+MFCC为参数、基于矢量量化的说话人识别系统的训练和测试程序。对于VQ模型,码本数的选取对识别率有很大的影响,实验证明选取128时最合适。最后对本文的工作进行了总结,同时对未来的研究工作进行了展望。

全文目录


摘要  5-6
ABSTRACT  6-12
1 绪论  12-17
  1.1 说话人识别的研究历史及现状  12-13
  1.2 主要的应用领域  13-15
  1.3 说话人识别技术的难点和热点  15-16
  1.4 本文论文组织结构  16-17
2 说话人识别技术  17-25
  2.1 说话人识别的基本原理  17-18
  2.2 说话人识别的分类  18-19
  2.3 说话人识别的特征参数  19-20
  2.4 说话人识别主要的分类方法  20-23
  2.5 特征参数的评价方法  23-25
3 语音信号的分析与初步处理  25-37
  3.1 语音信号的产生模型  25-27
  3.2 语音信号的预处理  27-37
4 语音特征参数提取  37-45
  4.1 线性预测系数  37-41
  4.2 LPC倒谱系数  41-43
  4.3 基于听觉特性的Mel频率倒谱系数  43-45
5 矢量量化识别方法及其优化  45-58
  5.1 概述  45
  5.2 矢量量化的工作原理  45-48
  5.3 矢量量化的失真测度  48-50
  5.4 矢量量化的最佳码本设计  50-53
  5.5 矢量量化识别方法的优化  53-58
6 系统实现与实验结果  58-64
  6.1 实验软硬件条件  58
  6.2 实验语音库  58-59
  6.3 应用矢量量化的说话人识别  59-64
7 结论  64-65
参考文献  65-67
致谢  67

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  3. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  4. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  5. Q学习在基于内容图像检索技术中的应用,TP391.41
  6. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  7. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  8. 空间交会接近视觉测量方法研究,TP391.41
  9. 图像实时采集、存储与处理方法研究,TP391.41
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 多币种纸币处理技术的研究与实现,TP391.41
  12. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  13. 基于图像的路面破损识别,TP391.41
  14. 移动机器人视觉检测和跟踪研究,TP242.62
  15. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  16. 基于随机森林的植物抗性基因识别方法研究,Q943
  17. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  18. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  19. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  20. 红外图像目标识别及跟踪技术研究,TP391.41
  21. 水下目标特征的压缩与融合技术研究,TN911.7

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com